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Nota de 


En el transcurso de los años, hemos recibido muchas felicitaciones por este texto, 
y comprendido que es un favorito de los estudiantes. Reconocemos que eso es 
un gran cumplido y seguimos trabajando muy duro para mantener ese estatus. 

El objetivo de Estadística aplicada a los negocios y la economía consiste en 
proporcionar a aquellos estudiantes de administración, marketing, finanzas, con- 
tabilidad, economía y otros campos de la administración de negocios, una visión 
introductoria de las muchas aplicaciones de las estadísticas descriptivas e infe- 
renciales. Nos enfocamos en sus aplicaciones comerciales, pero también pode- 
mos utilizar muchos ejercicios y ejemplos que se relacionan con el mundo actual 
del estudiante universitario. No es necesario contar con un curso previo en esta- 
dística, y los requisitos matemáticos corresponden al álgebra de primer año. 

En este texto, mostramos a los estudiantes principiantes los pasos que nece- 
sitan para tener éxito en un curso básico de estadística. Este enfoque paso a 
paso aumenta el desempeño, acelera la preparación y mejora significativamente 
la motivación. Su enfoque principal es entender los conceptos, ver y realizar mu- 
chos ejemplos y ejercicios, así como comprender la aplicación de los métodos 
estadísticos en los negocios y la economía. 

En 1967 se publicó la primera edición de este texto. En aquel entonces era 
difícil localizar datos relevantes con respecto a los negocios. ¡Todo eso ha cam- 
biado! Hoy en día, localizar los datos ya no constituye un problema. El número de 
artículos que se compran en la tienda de abarrotes se registra de manera auto- 
mática en la máquina registradora. Las compañías telefónicas rastrean constan- 
temente la fecha y hora de nuestras llamadas, su duración y la identidad de la 
persona a quien llamamos. Las compañías de tarjetas de crédito conservan la in- 
formación relacionada al número, hora, fecha y cantidad de nuestras compras. 
Los aparatos médicos monitorean nuestro ritmo cardiaco, presión sanguínea y 
temperatura desde lugares remotos. Una gran cantidad de información de nego- 
cios se registra y se reporta casi al instante. CNN, USA Today y MSNBC, por 
ejemplo, poseen sitios web que rastrean los precios de las acciones con un retra- 
so menor a los 20 minutos. 

En la actualidad se requieren habilidades para manejar un gran volumen de 
información numérica. Primero, debemos ser consumidores críticos de la infor- 
mación que nos presentan. Segundo, necesitamos ser capaces de reducir gran- 
des cantidades de información en una forma concisa y significativa que nos 
permita realizar interpretaciones, juicios y decisiones eficaces. Todos los estu- 
diantes tienen calculadoras y la mayoría cuenta con computadoras personales o 
con acceso a ellas en un laboratorio del campus; y, en general, tienen instalado 
el software estadístico, Microsoft Excel y Minitab. Los comandos necesarios para 
obtener resultados del software aparecen en una sección especial al final de cada 
capítulo. Utilizamos capturas de pantalla en los capítulos, para que el estudiante 
se familiarice con la naturaleza de la aplicación. 

Debido a la disponibilidad actual de software y computadoras, ya no es nece- 
sario perder tiempo haciendo cálculos. Hemos reemplazado muchos de los ejem- 
plos de cálculo con ejemplos interpretativos, para ayudar al estudiante a entender 
e interpretar los resultados estadísticos. Además, ahora hacemos mayor hincapié 
en la naturaleza conceptual de los temas estadísticos. No obstante esos cambios, 
seguimos presentando, en la mejor forma posible, los conceptos clave junto con 
ejemplos de apoyo interesantes y relevantes. 
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los autores 


/Qué hay de nuevo en esta decimoquinta edición? 

Hemos hecho algunos cambios en esta edición, que pensamos les resultarán úti- 
les y oportunos a usted y sus alumnos. 

• Revisamos los objetivos de aprendizaje para hacerlos más específicos; agre- 
gamos algunos, los identificamos en los márgenes y los relacionamos direc- 
tamente con las secciones que contiene el capítulo. 

• Reemplazamos el ejemplo clave en los capítulos 1 a 4. El nuevo ejemplo abar- 
ca más variables y observaciones. Presenta una situación de negocios realis- 
ta. También se le utiliza más tarde en el texto, en el capítulo 13. 

• Añadimos o revisamos diversas secciones nuevas en varios capítulos: 

■ El capítulo 7 incluye una exposición sobre la distribución exponencial. 

■ El capítulo 9 fue reorganizado para hacerlo más ilustrativo y mejorar el flujo 
de los temas. 

■ El capítulo 13 fue reorganizado e incluye un test de hipótesis sobre el decli- 
ve del coeficiente de regresión. 

■ El capítulo 17 incluye un test gráfico sobre la normalidad y la prueba de ji 
cuadrado de la normalidad. 

• Hay nuevos ejercicios y ejemplos que utilizan capturas de pantalla de Excel 
2007 y la versión más reciente de Minitab. También hemos aumentado el 
tamaño y la claridad de estas capturas de pantalla. 

• Incluimos nuevos comandos de Excel 2007 y comandos actualizados de 
Minitab al final de cada capítulo. 

• Revisamos cuidadosamente los ejercicios que contienen los capítulos, los 
que se presentan al final de ellos y en la sección de Repaso. Añadimos 
muchos ejercicios nuevos o revisados a lo largo del texto. Usted todavía 
puede encontrar y asignar sus ejercicios favoritos, aquellos que han funciona- 
do bien, o puede introducir ejemplos frescos. 

• Añadimos números a las secciones para identificar los temas con más clari- 
dad y poder encontrarlos fácilmente. 

• Revisamos la sección de Ejercicios de la base de datos al final de cada ca- 
pítulo. 

• Actualizamos los datos de béisbol a la temporada de 2009. Agregamos una 
nueva aplicación de negocios, que se refiere al uso y mantenimiento de la 
flota de camiones escolares del Distrito de Buena Vista. 

• Hay muchas fotografías nuevas en el texto, con ejercicios actualizados a la 
entrada de los capítulos. 
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¿Cómo se organizan los capítulos para comprometer 


Objetivos de aprendizaje del capítulo 

Cada capítulo comienza con un conjunto de objetivos de apren- 
dizaje, diseñados para enfocarse en los temas tratados y moti- 
var el aprendizaje de los alumnos. Localizados en el margen 
próximo al tema, estos objetivos indican lo que el estudiante 
debería ser capaz de hacer después de completar el capítulo. 

Ejercicio a la entrada del capítulo 

Cada capítulo comienza con un ejercicio representativo y mues- 
tra cómo el contenido correspondiente puede aplicarse a una 
situación de la vida real. 



Introducción al tema 

Cada capítulo inicia con una revisión de los con- 
ceptos importantes del que le antecedió y pro- 
porciona un vínculo para el material en el 
capítulo actual. Este enfoque paso a paso eleva 
la comprensión pues proporciona continuidad al 
flujo de conceptos. 



Ejemplo/solución 

Una vez introducidos los conceptos importan- 
tes, se presenta un ejemplo resuelto para ¡lustrar 
a los estudiantes sobre “cómo hacerlo”, y mos- 
trar una aplicación relevante de negocios o en 
base a la economía; este recurso ayuda a res- 
ponder la pregunta: “¿Para qué puedo usar 
esto?” Todos los ejemplos brindan una aplica- 
ción o un escenario realista, y logran que la di- 
mensión y la escala matemáticas sean razona- 
bles para los alumnos principiantes. 



Autoevaluacíones 

A lo largo de cada capítulo se presen- 
tan autoevaluacíones muy apegadas a 
los ejemplos previos. Esto ayuda a los 
estudiantes a monitorear su progreso 
y proporciona un refuerzo inmediato 
para dicha técnica en particular. 
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a los estudiantes y promover el aprendizaje? 


Estadística en acción 

Los artículos de Estadística en acción se encuen- 
tran diseminados por todo el texto, por lo general, 
dos por capítulo. Proporcionan aplicaciones úni- 
cas e interesantes, así como perspectivas histó- 
ricas en el campo de la estadística. 


Notas al margen 

Hay más de 300 notas concisas al margen. 
Cada una pretende resaltar la importancia de 
los conceptos clave adyacentes. 

Definiciones 

Las definiciones de términos nuevos o exclu- 
sivos al ámbito estadístico están situadas in- 
dependientemente del texto y las hemos re- 
saltado para facilitar su referencia y revisión. 




Fórmulas 

Las fórmulas que se utilizan por primera vez 
están encerradas en un recuadro y numeradas 
para simplificar su referencia. Además, hay una 
tarjeta de fórmula ligada en el reverso del texto, 
que enlista todas las fórmulas clave. 



Ejercicios 

Los ejercicios se ubican después de las seccio- 
nes dentro del capítulo y al terminar éste. Los 
ejercicios de sección cubren el material que se 
estudió en la misma. 



Capturas de pantalla 

El texto incluye muchos ejemplos en software, 
utilizando Excel, MegaStat® y Minitab. 






¿Cómo refuerza este 


POR CAPÍTULO 

Resumen del capítulo 

Cada capítulo contiene un breve resumen del 
material que se estudia en él, incluyendo el 
vocabulario y las fórmulas más Importantes. 


Resumen del copítulo 



1 «NI 

B 


Clave de pronunciación 

Esta herramienta enlista el símbolo matemático, su 
significado y cómo pronunciarlo. Pensamos que 
esto ayudará al estudiante a retener el significado del 
símbolo y que mejora en general las comunicacio- 
nes del curso. 


Clave de pronunciación 


L aubnftc*? 
Obamm 1 


Ejercicios del capítulo 

ejercicios det copitulo 

comcct f? w • j t m i i m whww imw ♦ m Iwnb» u t.» 

En términos generales, los ejercicios de final del 


capítulo son los más desafiantes e integran los 
conceptos ahí estudiados. Las respuestas y las 
soluciones ya trabajadas de todos los ejercicios 

J | | , , 

4 1 1 1 4 

Impares aparecen al final del texto. 



Ejercicios de la base de datos 

Los ejercicios que están al final de cada capítulo se basan en 
tres grandes conjuntos de datos, que aparecen en el apéndice 
A del texto y también en el sitio web del libro, www.mhhe.com/ 
uni/lindeane15e. Estos conjuntos de datos confrontan a los 
estudiantes con aplicaciones del mundo real mucho más com- 
plejas. 



Comandos de software 

A todo lo largo del texto se incluyen ejemplos de 
software que utilizan Excel, MegaStat® y Mlnltab, 
pero las explicaciones de los comandos de cada 
programa para Ingresar los datos están al final de 
cada capítulo. Esto permite que el estudiante se 
enfoque en las técnicas estadísticas más que en 
cómo ingresar los datos. 
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texto el aprendizaje? 


Respuestas a las 
autoevaluaciones 

Al final de cada capítulo se proporcionan las 
soluciones a los ejercicios de autoevaluación. 



POR SECCIÓN 

Repaso de las secciones 

Se incluye un repaso de sección en varios grupos selec- 
tos de capítulos (1 -4, 5-7, 8y9, 10-12, 13y14, 15y16, 
y 17 y 18). Parecido a un repaso antes del examen, esto 
incluye una breve perspectiva general de los capítulos, 
un glosario de los principales términos y problemas 
para repasar. 



Casos 

El repaso incluye también casos continuados y varios ca- 
sos más pequeños que permiten que los estudiantes to- 
men decisiones mediante técnicas y herramientas apren- 
didas en diversos capítulos. 



Test de práctica 

El objetivo del test de práctica es dar a los estudiantes 
una idea del contenido que puede aparecer en un exa- 
men y cómo éste puede estar estructurado. Además, 
incluye preguntas objetivas y problemas que cubren el 
material que se estudió en la sección. 

Complementos 

Este libro de texto cuenta con un amplio paquete de 
apoyos. Consulte a su representante de McGraw-Hill 
para términos y condiciones. 
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Mejoras a la 15 a edición de Estadística aplicada 
a los negocios v la economía 


Cambios en todos los capítulos y modificaciones 
importantes en algunos de ellos: 

• Se cambiaron las metas de los objetivos de aprendizaje y 
se identificó la parte del capítulo donde se expone cada 
objetivo. 

• Se añadieron números a los encabezados principales. 

• Se revisó el grupo de datos de las Ligas Mayores de Béis- 
bol para reflejar la temporada 2009. 

• Se revisaron los datos de bienes raíces para asegurar que 
los resultados fuesen más apegados a la economía actual. 

• Se añadió un nuevo grupo de datos con respecto a los 
autobuses escolares en un sistema de educación pública. 

• Se actualizaron las pantallas de Excel 2007, Minitab y 
MegaStat. 

• Se revisó el ejemplo principal de los capítulos 1-4 para que 
reflejara las condiciones económicas actuales relativas a 
los distribuidores de automóviles. Este ejemplo se expone 
también en los capítulos 13 y 17. 

• Se añadió una nueva sección en el capítulo 13 que des- 
cribe una prueba para determinar si el declive de la línea 
de regresión es distinta de cero. 

• Se añadieron actualizaciones y aclaraciones en todo el 
texto. 

Capítulo 1 ¿Qué es la estadística? 

• Nueva fotografía y un ejercicio al inicio del capítulo sobre 
el “Nook” que vende Barnes and Noble. 

• Actualizaciones del censo de la población estadounidense, 
ventas de aviones Boeing y datos de Forbes en el recua- 
dro de “Estadística en acción”. 

• Nuevos ejercicios: 17 (datos sobre las ventas de vehículos 
en 2010) y 19 (ventas de ExxonMovil antes del derrame de 
petróleo en el Golfo). 

Capítulo 2 Descripción de datos: tablas de 
frecuencias, distribuciones de frecuencias y su 
representación gráfica 

• Nuevos datos sobre los gastos de la Ohio State Lottery en 
2009, con una nueva captura de pantalla de Excel 2007. 

• Nuevos ejercicios: 45 (la elección de la novias de su lugar 
para casarse) y 46 (ingresos en el estado de Giorgia). 

Capítulo 3 Descripción de datos: medidas numéricas 

• Nuevos datos sobre los promedios en la introducción: 
número promedio de televisores por hogar, gasto promedio 
de una boda y el precio promedio de un boleto de teatro. 

• Nueva descripción del cálculo e interpretación de la media 
poblacional, usando la distancia entre las salidas de la 1-75 
en Kentucky. 


• Nueva descripción de la mediana utilizando la administra- 
ción del tiempo en las cuentas de Facebook. 

• Ejemplo/solución actualizados sobre la población de Las 
Vegas. 

• Actualización de “Estadística en acción” sobre el promedio 
de bateo más alto en las Ligas Mayores de Béisbol en 
2009. Fue de Joe Mauer, de los Gemelos de Minnesota, 
con un promedio de .365. 

• Nuevos ejercicios: 22 (comisiones por ventas de bienes raí- 
ces), 67 (hábitos de lavado de ropa), 77 (universidades 
públicas en Ohio), 72 (valores de azúcar en sangre) y 82 
(ganancias en el Derby de Kentucky). Se revisaron los ejer- 
cicios 30 al 34 para incluir los datos más recientes. 

Capítulo 4 Descripción de datos: presentación y 
análisis de datos 

• Nuevo ejercicio: 22, con datos de los salarios de los Yan- 
kees de Nueva York en 2010. 

• Nuevo ejercicio: 36 (membresía de enfermeras de la Ame- 
rican Society of Peri-Anesthesia. 

Capítulo 5 Estudio de los conceptos de la 
probabilidad 

• Nuevos ejercicios: 58 (número de hits en un juego de béis- 
bol de Ligas Mayores), 59 (ganar un torneo) y 60 (ganar en 
Jeopardy). 

Capítulo 6 Distribuciones de probabilidad discreta 

• Sin cambios. 

Capítulo 7 Distribuciones de probabilidad continua 

• Nuevas autoevaluaciones 7-4 y 7-5, con respecto a la tem- 
peratura del café. 

• Nuevo ejercicio: 26 (Prueba SAT de razonamiento). 

• Nuevo ejercicio: 29 (Rango de obstáculos para la inversión 
económica). 

• Nueva sección sobre la distribución de probabilidad expo- 
nencial, con sus problemas correspondientes. 

• Diversas actualizaciones y aclaraciones en el glosario. 

Capítulo 8 Métodos de muestreo y teorema central 
del límite 

• Sin cambios. 

Capítulo 9 Estimación e intervalos de confianza 

• Una nueva sección de Estadística en acción, que describe 
la economía de combustible del EPA. 

• Una nueva sección sobre estimación de puntos. 

• Integración y aplicación del teorema central del límite. 
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a los negocios v la economía 


• Exposición revisada sobre la determinación del intervalo de 
confianza de la media poblacional. 

• Aumento en la sección sobre cómo calcular el tamaño de 
la muestra. 

• Nuevos ejercicios: 12 (consumo de leche), 33 (costo de los 
departamentos en Milwaukee), 47 (prueba de drogas en la 
industria de la moda) y 48 (encuesta entre los propietarios 
de pequeños negocios con respecto al cuidado de la 
salud). 

• Se reubicó la exposición sobre el factor finito de correc- 
ción. 

Capítulo 10 Pruebas de hipótesis de una muestra 

• Nuevos ejercicios: 17 (consumo diario de agua), 19 (número 
de mensajes de texto entre los adolescentes), 35 (tamaño de 
los hogares en Estados Unidos), 49 (resultados de los vola- 
dos en el Súper Tazón), 54 (el fracaso de las máquinas tra- 
gamonedas en la industria del juego), 57 (estudio del por- 
centaje de estadounidenses que no desayunan) y 60 (uso 
diario del agua). 

Capítulo 11 Pruebas de hipótesis de dos muestras 

• Nuevos ejercicios: 15 (salarios de los Yankees de Nueva 
York en 2010), 37 (encuesta sobre la confianza del consu- 
midor) y 39 (mascotas como escuchas). 

Capítulo 12 Análisis de la varianza 

• Se revisaron los nombres de las aerolíneas en el ejemplo 
de los viajes de ida de ANOVA. 

• Nuevo ejercicio: 30 (tiempos de vuelo entre Los Ángeles y 
San Francisco). 

Capítulo 13 Regresión lineal y correlaeión 

• Se reescribió la introducción del capítulo. 

• Se añadió una nueva sección utilizando los datos del 
Applewood Auto Group de los capítulos 1 al 4. 

• Se añadió una exposición de la tabla de regresión ANOVA, 
con ejemplos de Excel. 

• Se reescribió y se reubicó la sección del coeficiente de 
determinación. 

• Se actualizó el ejercicio 60 (cantidades en las taquillas de 
los cines). 

Capítulo 14 Análisis de correlación y regresión 
múltiple 

• Se reescribió la sección sobre cómo evaluar la ecuación de 
la regresión múltiple. 


• Se hizo mayor hincapié en la tabla de regresión ANOVA. 

• Se resaltó la exposición sobre el valor p en la toma de deci- 
siones. 

• Se añadió una sección sobre las variables cualitativas en el 
análisis de regresión. 

• Se movió la sección “Regresión por pasos” para mejorar la 
secuencia de temas. 

• Se añadió un problema en el resumen al final del capítulo 
para repasar los conceptos principales. 

Capítulo 15 Números índices 

• Se actualizaron los datos económicos y de censo. 

Capítulo 16 Series de tiempo y proyección 

• Se actualizaron los datos económicos. 

Capítulo 17 Métodos no paramétricos: pruebas de 
bondad de ajuste 

• Se trabajó el Ejemplo/solución en la prueba de precisión de 
ajuste de /'/'-cuadrada con frecuencias de células equivalen- 
tes (comidas favoritas de los adultos). 

• Se añadió una sección para describir la prueba de preci- 
sión de ajuste para saber si una muestra de datos pro- 
viene de una población normal, con sus ejemplos corres- 
pondientes. 

• Se añadió una sección utilizando los métodos gráficos para 
probar si una muestra de datos proviene de una población 
normal, con sus ejemplos correspondientes. 

Capítulo 18 Métodos no paramétricos: análisis de 
datos ordenados 

• Se revisó el Ejemplo/solución de la prueba de Kruskai- 
Wallis (tiempos de espera en una sala de urgencias). 

• Se revisó el Ejemplo/solución del coeficiente de Spearman 
de correlación de rangos (comparación de las puntuacio- 
nes de reclutamiento y planta para personas en capaci- 
tación). 

Capítulo 19 Control estadístico del proceso y 
administración de calidad 

• Se actualizó la sección del Malcolm Baldrige National Qua- 
lity Award. 

• Se trabajó y se actualizó la sección sobre Six Sigma. 
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¿Qué es la estadística? 


Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



OA1 Mencionar diversas for- 
mas en que puede usarse la 
estadística. 

OA2 Conocer las diferencias 
entre estadística descriptiva 
y estadística inferencia!. 

OA3 Comprender las diferen- 
cias entre una muestra y una 
población. 

OA4 Distinguir entre una 
variable cualitativa y una 
variable cuantitativa. 

OA5 Describir la diferencia 
entre una variable discreta y 
una variable continua. 

OA6 Distinguir entre los nive- 
les de medición de datos. 


Recientemente, las tiendas Barnes & Noble comenzaron a vender la 
Nook, un dispositivo mediante el cual se pueden descargar electróni- 
camente más de 1 500 libros, y leerlos en un pequeño monitor en vez 
de comprar el libro. Suponga que usted tiene el número de Nook que 
se vendieron cada día durante el último mes en la tienda de Barnes & 
Noble del Market Commons Malí en Riverside, California. Describa 
una condición en la que esta información podría ser considerada una 
muestra. Ejemplifique una segunda situación en la que los mismos 
datos podrían ser considerados una población (vea ejercicio 1 1 y 
objetivo 3). 
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CAPÍTUL0 1 ¿Qué es la estadística? 


1.1 Introducción 

Hace más de cien años, H. G. Wells, escritor e historiador inglés, dijo que algún día el razona- 
miento cuantitativo sería tan importante para la gran mayoría de los ciudadanos como la capa- 
cidad de leer. No mencionó el área de los negocios, ya que la Revolución Industrial apenas 
comenzaba. No obstante, Wells tenía razón. Si bien la experiencia en los negocios, cierta habi- 
lidad para hacer pronósticos razonados y la intuición constituyen atributos funda- 
mentales de los gerentes con éxito, los problemas que en la actualidad se presen- 
tan en los negocios tienden a ser demasiado complejos como para tomar decisio- 
nes sólo a partir de estos criterios. 

Una de las herramientas que se utilizan para tomar decisiones es la estadística. 
De la estadística no sólo se sirve la gente dedicada a los negocios; en nuestra vida 
cotidiana también aplicamos conceptos estadísticos. Por ejemplo, para comenzar el 
día, abra la regadera y deje correr el agua unos segundos. En seguida moje su mano 
para percatarse si la temperatura es adecuada o decidir si abre más la llave del agua 
caliente o la del agua fría. Ahora suponga que está en una tienda comercial y quie- 
re comprar una pizza congelada. Dos marcas tienen un puesto de promoción, y 
cada una le ofrece una pequeña rebanada. Después de probar, decide cuál comprar. En 
ambos ejemplos, usted toma la decisión y elige lo que hará, a partir de una muestra. 

Las empresas enfrentan situaciones similares. Por ejemplo, Kellogg Company debe ga- 
rantizar que la cantidad promedio de Raisin Bran en una caja de 25.5 gramos cumpla con la 
que se especifica en la etiqueta. Para hacerlo fija un peso objetivo un poco más alto que 
la cantidad que dice en la etiqueta. Las cajas se pesan después de ser llenadas. La báscula 
indica la distribución de los pesos del contenido por hora, así como la cantidad de cajas de- 
sechadas por no cumplir con las especificaciones de la etiqueta en el transcurso de dicha 
hora. El Departamento de Control de Calidad también selecciona de forma aleatoria muestras 
de la línea de producción y verifica la calidad del producto y el peso de la caja. Si es significa- 
tiva la diferencia entre el peso promedio del producto y el peso objetivo o el porcentaje de 
cajas desechadas es muy alto, el proceso se ajusta. 

Como estudiante de administración o de economía, requerirá conocimientos básicos y 
habilidad para organizar, analizar y transformar datos, así como para presentar la información. 
En esta obra aprenderá las técnicas y métodos estadísticos básicos que mejorarán su destre- 
za para tomar buenas decisiones personales y de naturaleza administrativa. 


1.2 / Por qué se debe estudiar estadística? 

Si revisa el plan de estudios de la universidad, se dará cuenta de que varios programas uni- 
versitarios incluyen la estadística. ¿Por qué razón? ¿Cuáles son las diferencias entre los cur- 
sos de estadística que se imparten en la Facultad de Ingeniería, los Departamentos de 
Psicología o Sociología en la Escuela de Artes Liberales y la Facultad de Administración? La 
diferencia principal consiste en los ejemplos que se utilizan. El contenido del curso es el 
mismo. En la Facultad de Administración el interés son cuestiones como las utilidades, las 
horas de trabajo y los salarlos. A los psicólogos les importan los resultados de las pruebas, y 
a los ingenieros la cantidad de unidades que fabrica determinada máquina. No obstante, en 
los tres casos, el interés se centra en el valor típico y la variación que experimentan los datos. 
También existe una diferencia en el nivel de los cálculos matemáticos que se requieren. Un 
curso de estadística para ingenieros incluye el cálculo. Los cursos de estadística en las facul- 
tades de administración y pedagogía, por lo general, se imparten desde el punto de vista de 
las aplicaciones. Si usted ya estudió álgebra en la escuela secundaria, manejará adecuada- 
mente la matemática que se emplea en el texto. 

Entonces, ¿por qué se requiere la estadística en muchas empresas importantes? La pri- 
mera razón consiste en que la información numérica prollfera por todas partes. Revise los 
periódicos ( USA Today), revistas de noticias (Time, Newsweek, U.S. News y World Report), 
revistas de negocios ( BusinessWeek , Forbes), revistas de interés general (Peop/e), revistas 
para mujeres (Ladies, Home Journal o Elle) o revistas deportivas ( Sports lllustrated, ESPN The 
Magazine), y quedará abrumado con la cantidad de información numérica que contienen. 


0A1 Mencionar diversas 
formas en que puede usarse 
la estadística. 


Ejemplos de las razones por 
las cuales se estudia 
estadística. 
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He aquí algunos ejemplos: 

• El incremento promedio del ingreso familiar semanal de 1 982-84 dólares, fue de 8.32 dóla- 
res de enero de 2009 a enero de 2010. 

• En enero de 2010, la cantidad promedio de deuda a tarjeta de crédito por familia en 
Estados Unidos era de 7 394 dólares, lo que representa una reducción de los 7 801 dóla- 
res de julio de 2009. Una encuesta de la Reserva Federal en 2010 reveló que 75% de las 
familias tenía cuando menos una tarjeta de crédito. 

• La tabla siguiente resume el número de aviones comerciales fabricados por Boeing, Inc., 
entre 2006 y 2009. 


Ventas de aviones Boeing 

Tipo de avión 

Año 

737 

747 

767 

777 

787 

Total 

2006 

733 

72 

8 

77 

160 

1 050 

2007 

850 

25 

36 

143 

369 

1 423 

2008 

488 

4 

29 

54 

94 

669 

2009 

197 

5 

7 

30 

24 

263 


• Vaya al siguiente sitio: www.youtube.com/watck?v=pMcfrLYDm2U. Ahí encontrará inte- 
resante información numérica acerca de países, negocios, política y geografía. 

• Usa Today (www.usatoday.com) publica “instantáneas” (Snapshots) que muestran el resul- 
tado de encuestas conducidas por diversas organizaciones, fundaciones y el gobierno 
federal estadounidenses. La siguiente tabla resume lo que buscan los reclutadores cuan- 
do tienen que contratar empleados estacionales. 


USA TODAY Snapshot 


Sobre todo, los reclutadores 
intentan detectar una actitud 
positiva cuando contratan 
empleados estacionales. 


Qué buscan los 

Actitud 

reclutadores 

positiva 

al contratar 

36% 

empleados 


estacionales 

14% 


Compromiso para 
trabajar todo el verano 


Capacidad para trabajar 
una jornada diaria ' 

27% 

23% 

Experiencia 
previa 
en la 
industria 


"■I 

á 


Por: Jae Yang y Paul Trap, USA TODAY 
Fuente: SnagAJob.com 

Reimpreso con autorización (29 de abril de 2010) USA TODAY. 


Una segunda razón para inscribirse en un curso de estadística estriba en que las técnicas 
estadísticas se emplean para tomar decisiones que afectan la vida diaria, es decir, que influ- 
yen en su bienestar. He aquí algunos ejemplos: 

• Las compañías de seguros utilizan el análisis estadístico para establecer tarifas de segu- 
ros de casas, automóviles, de vida y de servicio médico. Las tablas disponibles contienen 
cálculos aproximados de que a una mujer de 20 años de edad le queden 60.25 años de 
vida; a una mujer de 87 años le queden 4.56 años de vida y a un hombre de 50 años 27.85. 
Las primas de seguros de vida se establecen con base en estos cálculos de expectati- 
vas de vida. Estas tablas se encuentran disponibles en www.ssa.gov/OACT/STATS/ 
table4cb.htm (este sitio acepta mayúsculas). 
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Estadística en acción 

Centre su atención en el 
título Estadística en 
acción. Lea con cuidado 
para obtener una idea de 
la amplia gama de aplica- 
ciones de la estadística en 
la administración, econo- 
mía, enfermería, cumpli- 
miento de la ley, deportes 
y otras disciplinas. 

• En 2009, F orbes publi- 
có una lista de los esta- 
dounidenses más ricos. 
William Gates, funda- 
dor de Microsoft 
Corporation, es el 
hombre más rico. Su 
fortuna se calcula en 
59 mil millones de 
dólares 

(www.forbes.com) . 

• En 2009, las cuatro 
compañías estadouni- 
denses con mayores 
ingresos fueron 
Walmart, ExxonMobil, 
Chevron y General 
Electric 

(www.forbes.com) . 

• En Estados Unidos, un 
típico estudiante gra- 
duado de la escuela 
secundaria gana 1.2 
millones de dólares en 
el transcurso de su 
vida; un típico gradua- 
do universitario gana 
2.1 millones de dólares 
y un típico posgradua- 
do gana 2.5 millones 
de dólares 

(usgovinfo.about.com/ 

library/weekly/ 

aa072602a.htm). 


• La Agencia de Protección del Ambiente está interesada en la calidad del agua del lago 
Erie, entre otros. Con periodicidad toma muestras de agua para determinar el nivel de 
contaminación y mantener la norma de calidad. 

• Los investigadores médicos estudian los índices de curación de enfermedades mediante 
la utilización de diferentes fármacos y diversos tratamientos. Por ejemplo, ¿cuál es el efec- 
to que resulta de operar cierto tipo de lesión de rodilla o de aplicar terapia física? Si se 
ingiere una aspirina cada día, ¿se reduce el riesgo de un ataque al corazón? 

Una tercera razón para inscribirse radica en que el conocimiento de sus métodos facilita 
la comprensión de la forma en que se toman decisiones y proporciona un entendimiento más 
claro de cómo le afectan. 

Sin que importe el empleo que haya elegido, usted encarará la necesidad de tomar deci- 
siones en las que saber hacer un análisis de datos resultará de utilidad. Con el fin de tomar 
una decisión informada, será necesario llevar a cabo lo siguiente: 

1 . Determinar si existe información adecuada o si requiere información adicional. 

2. Reunir información adicional, si se necesita, de manera que no se obtengan resultados 
erróneos. 

3. Resumir los datos de manera útil e informativa. 

4. Analizar la información disponible. 

5. Obtener conclusiones y hacer inferencias al mismo tiempo que se evalúa el riesgo de 
tomar una decisión incorrecta. 

Los métodos estadísticos expuestos en la obra le proporcionarán un esquema del proce- 
so de toma de decisiones. 

En suma, existen por lo menos tres razones para estudiar estadística: 1) los datos prolife- 
ran por todas partes; 2) las técnicas estadísticas se emplean en la toma de decisiones que 
influyen en su vida; 3) sin que importe la carrera que elija, tomará decisiones profesionales 
que incluyan datos. Una comprensión de los métodos estadísticos permite tomar decisiones 
con mayor eficacia. 


1.3 ;Qué se entiende por estadística? 

¿Cuál es la definición de estadístical Nos topamos con ella en el lenguaje cotidiano. En reali- 
dad, posee dos significados: en su acepción más común, la estadística se refiere a informa- 
ción numérica. Algunos ejemplos son el sueldo inicial de los graduados universitarios, el 
número de muertes que provocó el alcoholismo el año pasado, el cambio en el promedio 
industrial Dow Jones de ayer a hoy y la cantidad de cuadrangulares conectados por los 
Cachorros de Chicago durante la temporada 2010. En estos ejemplos las estadísticas refieren 
un valor o un porcentaje. Otros ejemplos incluyen: 

• El automóvil típico en Estados Unidos viaja 17 858 kilómetros al año; el autobús, 15 049 
kilómetros cada doce meses y el camión, 22 433 kilómetros anuales. En Canadá, la infor- 
mación correspondiente es de 1 6 687 kilómetros en el caso de los automóviles, de 31 895 
en el caso de los autobuses y de 1 1 264.60 en el de los camiones. 

• El tiempo promedio de espera para asesoría técnica es de 17 minutos. 

• La longitud promedio del ciclo económico de negocios desde 1945 es de 61 meses. 

Todos éstos constituyen ejemplos de estadísticas. Una colección de información numérica 
recibe el nombre de estadísticas. 

A menudo la información estadística se presenta en forma gráfica, la cual es útil porque 
capta la atención del lector e incluye una gran cantidad de información. Por ejemplo, la gráfi- 
ca 1-1 muestra el volumen y las acciones de Frito-Lay respecto de las principales categorías 
de papas fritas y botanas en los supermercados de Estados Unidos. Es suficiente un vistazo 
para descubrir que se vendieron cerca de 800 millones de libras de papas fritas y que Frito- 
Lay vendió 64% del total. Observe, asimismo, que Frito-Lay posee 82% del mercado de fritu- 
ras de maíz. 


1 .3 ¿Qué se entiende por estadística? 
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GRÁFICA 1 -1 Volumen y acciones de Frito-Lay en las principales categorías de botanas en los 
supermercados de Estados Unidos 


Como verá, la estadística tiene un significado mucho más amplio que la simple recolec- 
ción y publicación de información numérica. Definimos a la estadística como: 


ESTADÍSTICA Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de 
propiciar una toma de decisiones más eficaz. 


Como lo sugiere la definición, el primer paso en el estudio de un problema consiste en reco- 
ger datos relevantes. Éstos deben organizarse de alguna forma y, tal vez, representarse en una 
gráfica, como la gráfica 1-1. Sólo después de haber organizado los datos es posible analizar- 
los e interpretarlos. He aquí algunos ejemplos de la necesidad de recoger datos. 

• Los analistas dedicados a la investigación que trabajan para Merrill Lynch 
evalúan muchas facetas de determinadas acciones antes de hacer una reco- 
mendación de compra o venta. Recogen los datos de ventas anteriores de la 
compañía y calculan futuras ganancias. Antes de hacer recomendaciones, 
también consideran otros factores, como la demanda mundial prevista de los 
productos de la compañía, la fuerza de la competencia y el efecto del nuevo 
contrato en las relaciones con la administración sindical. 

• El departamento de marketing de Colgate-Palmolive Co., fabricante de pro- 
ductos de limpieza, tiene la responsabilidad de hacer recomendaciones 
sobre la posible rentabilidad de un grupo de jabones faciales recién crea- 
dos, con aromas frutales, como uva, naranja y piña. Antes de tomar la última 
decisión, lo promotores de mercado examinarán el producto en diversos mer- 
cados. Es decir, los anunciarán y venderán en Topeka, Kansas y Tampa, 
Florida. A partir de los resultados de esta prueba de marketing en estas dos 
regiones, Colgate-Palmolive decidirá si vende los jabones en todo el país. 

• Los administradores deben tomar decisiones referentes a la calidad de sus productos o 
servicios. Por ejemplo, los consumidores se comunican con las compañías de software 
para solicitar asesoría técnica cuando no pueden resolver algún problema. El tiempo que 
un consumidor debe esperar para que un asesor técnico conteste la llamada constituye 
una medida de la calidad del servicio que se le brinda. Una compañía de software podría 
establecer un minuto como objetivo del tiempo representativo de respuesta. Luego, debe- 
ría recabar y analizar los datos relativos al tiempo de respuesta. ¿Difiere el tiempo repre- 
sentativo de respuesta cierto día de la semana o durante alguna parte de un día? Si los 
tiempos de respuesta crecen, los administradores podrían tomar la decisión de aumentar 
la cantidad de asesores técnicos a ciertas horas del día o de la semana. 
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1.4 Tipos de estadística 

Por lo general, el estudio de la estadística se divide en dos categorías: la estadística descrip- 
tiva y la estadística inferencial. 

0A2 Conocer las diferencias 
entre estadística descriptiva y 
estadística inferencial. 


Estadística descriptiva 

Es la ciencia que “recoge, organiza, presenta, analiza... datos”. Esta parte de la estadística 
recibe el nombre de estadística descriptiva. 


ESTADÍSTICA DESCRIPTIVA Métodos para organizar, resumir y presentar datos de manera infor- 
mativa. 


Por ejemplo, el gobierno de Estados Unidos informa que en 1960, la población de este 
país fue de 179 323 000 personas; en 1970, de 203 302 000; en 1980, de 226 542 000; en 
1990, de 248 709 000 y en 2000, de 265 000 000. Esta información representa una estadísti- 
ca descriptiva. Se trata de estadística descriptiva si calcula el crecimiento porcentual de una 
década a otra. Sin embargo, no sería de naturaleza descriptiva si utilizara estos datos para 
calcular la población de Estados Unidos en el año 2020 o el crecimiento porcentual de 2010 
a 2020. ¿Por qué? Dichas estadísticas no se están utilizando para hacer un resumen de pobla- 
ciones del pasado, sino para calcular poblaciones en el futuro. Los siguientes son ejemplos de 
estadística descriptiva. 

• Hay un total de casi 68 859 kilómetros de carreteras interestatales en Estados Unidos. El 
sistema interestatal representa apenas 1% del total de carreteras de la nación, aunque 
alberga a más de 20% del tránsito. La más larga es la autopista 1-90, que va de Boston a 
Seattle, una distancia de 4 957.32 kilómetros. La más corta es la 1-878, localizada en 
Nueva York, cuya longitud es de 1.12 kilómetros. Alaska no cuenta con carreteras ¡nteres- 
tatales; Texas posee la mayor cantidad de kilómetros interestatales, 3 232, y Nueva York 
tiene la mayoría de las rutas interestatales, 28 en total. 

• Una persona promedio gastó 103.00 dólares en mercancía alusiva a San Valentín el 14 de 
febrero de 2010. Esto representa un aumento de 0.50 dólares con respecto a 2009. Como 
en años anteriores, los hombres gastaron el doble que las mujeres en esa fecha. El hom- 
bre promedio gastó 135.35 dólares para impresionar a sus seres queridos, mientras que las 
mujeres sólo gastaron 72.28. Las mascotas también sienten amor: una persona promedio 
gastó 3.27 dólares en su amigo peludo, en comparación con los 2.17 del año anterior. 

Una masa de datos desorganizados —como el censo de población, los salarios semana- 
les de miles de programadores de computadoras y las respuestas de 2 000 votantes registra- 
dos para elegir presidente de Estados Unidos— resulta de poca utilidad. No obstante, las téc- 
nicas de la estadística descriptiva permiten organizar esta clase de datos y darles significado. 
Los datos se ordenan en una distribución de frecuencia (en el capítulo 2 se estudia este pro- 
cedimiento). Se emplean diversas clases de gráficas para describir datos; en el capítulo 4 
también se incluyen diversas formas básicas de gráficas. 

Las medidas específicas de localización central, como la media, describen el valor central 
de un grupo de datos numéricos. Para describir la proximidad de un conjunto de datos en 
torno al promedio se emplean diversas medidas estadísticas. Estas medidas de tendencia 
central y dispersión se estudian en el capítulo 3. 

Estadística inferencial 

El segundo tipo es la estadística inferencial, también denominada inferencia estadística. El 
principal interés que despierta esta disciplina se relaciona con encontrar algo relacionado con 
una población a partir de una muestra de ella. Por ejemplo, una encuesta reciente mostró que 
sólo 46% de los estudiantes del último grado de secundaria podían resolver problemas 
que Incluyeran fracciones, decimales y porcentajes. Además, sólo 77% de los alumnos de últi- 
mo año de secundaria pudo sumar correctamente el costo de una ensalada, una hamburgue- 
sa, unas papas fritas y un refresco de cola, que figuraban en el menú de un restaurante. Ya 
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OA3 Comprender las 
diferencias entre muestra y 
población. 


Razones por las que se toman 
muestras. 


que éstas son Inferencias relacionadas con una población (todos los estudiantes de último 
grado de secundaria), basadas en datos de la muestra, se trata de estadística inferencia I. Se 
podría considerar a la estadística ¡nferencial como la mejor conjetura que es posible obtener 
del valor de una población sobre la base de la información de una muestra. 


ESTADÍSTICA INFERENCIA!. Métodos que se emplean para determinar una propiedad de una 
población con base en la información de una muestra de ella. 


Preste atención a las palabras población y muestra en la definición de estadística ¡nferen- 
cial. Con frecuencia hacen referencia a la población de 308.8 millones de personas que viven 
en Estados Unidos o a la población de 1 310 millones de habitantes de China. No obstante, 
en estadística, la palabra población posee un significado más amplio. Una población puede 
constar de individuos —como los estudiantes matriculados de la Universidad Estatal de Utah, 
los estudiantes de Contabilidad 201 o los presidentes de las compañías de Fortune 500 — . 
También puede consistir en objetos, tales como las llantas Cobra G/T producidas en Cooper 
Tire and Rubber Company en la planta de Findlay, Ohio; las cuentas por cobrar al finalizar 
octubre por Lorrange Plastics, Inc.; o los reclamos de seguro de automóvil archivados duran- 
te el primer trimestre de 201 0 en la Oficina Regional del Noreste de State Farm Insurance. Las 
medidas de interés podrían ser los resultados en el primer examen de los estudiantes de 
Contabilidad 201, el desgaste de la banda de rodamiento de las llantas Cooper, el monto en 
dólares de las notas por cobrar de Lorrange Plastics o la cantidad de reclamos de seguro de 
automóvil en State Farm. De esta manera, desde una perspectiva estadística, una población 
no siempre tiene que ver con personas. 


POBLACIÓN Conjunto de individuos u objetos de interés o medidas que se obtienen a partir 
de todos los individuos u objetos de interés. 


Con el objeto de inferir algo sobre una población, lo común es que tome una muestra de 

ella. 




MUESTRA Porción o parte de la población de interés. 




¿Por qué tomar una muestra en lugar de estudiar a cada miembro de la población? Una 
muestra de votantes registrados se hace necesaria en virtud de los costos prohibitivos de 
ponerse en contacto con millones de electores antes de una elección. Las pruebas sobre el 
trigo acerca de la humedad que lo destruye, hacen imprescindible la toma de una muestra. Si 
los catadores de vino probaran todo el vino, no quedaría una gota para vender. En la práctica 
resulta imposible que unos cuantos biólogos marinos capturaren y rastreen a todas las focas 
en el océano. (Éstas y otras razones para tomar muestras se estudian en el capítulo 8.) 

La toma de muestras para aprender algo sobre una población es de uso frecuente en 
administración, agricultura, política y acciones de gobierno, según lo muestran los siguientes 
ejemplos: 

• Las cadenas de televisión hacen un monitoreo continuo de la popularidad de sus progra- 
mas contratando a Nielsen y a otras organizaciones con el fin de que éstas tomen mues- 
tras sobre las preferencias de los telespectadores. Por ejemplo, en una muestra de 800 
televidentes que ven televisión a la hora de mayor audiencia, 320, o 40%, señaló que vio 
American Idol en Fox la semana pasada. Estos índices de audiencia se emplean para 
establecer tarifas de publicidad o para suspender programas. 

• Gamous and Associates, una firma de contadores públicos, realiza una auditoría a Pronto 
Printing Company. Para comenzar, la firma contable elige una muestra aleatoria de 100 
facturas y verifica la exactitud de cada una de ellas. Por lo menos hay un error en cin- 
co facturas; por consiguiente, la firma de contadores calcula que 5% de la población de 
facturas contiene al menos un error. 


CAPÍTUL0 1 ¿Qué es la estadística? 


Le recomendamos que realice 
el ejercicio de autoevaluación. 


Autoevaluación 1-1 



Variable cualitativa. 


OA4 Distinguir entre una 
variable cualitativa y una 
variable cuantitativa. 


• Una muestra aleatoria de 1 260 graduados de marketing de escuelas que imparten la 
carrera en cuatro años mostró que su sueldo inicial promedio era de 42 694 dólares. Por 
lo tanto, se estima que el sueldo inicial promedio de todos los graduados de contabilidad 
de instituciones que imparten la carrera en cuatro años es de 42 694 dólares. 

La relación entre una muestra y una población se presenta abajo. Por ejemplo, desea 
calcular los kilómetros promedio por litro de los vehículos SUV (sport utility vehicles). Se eli- 
gen seis SUV de la población. Se emplea la cantidad promedio de KPL (kilómetros por litro) de 
los seis para calcular la cantidad de MPG en el caso de la población. 


Población Muestra 


Todos los elementos Elementos elegidos 


1 

entre la p 

oblación 

ó o - - 
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En seguida aparece un ejercicio de autoevaluación. Estos ejercicios se encuentran inter- 
calados en cada capítulo. Someten a prueba su comprensión del material precedente. La res- 
puesta y método de solución aparecen al final del capítulo. La respuesta a la siguiente auto- 
evaluación se encuentra en la página 19. El lector debe intentar resolverlos y después compa- 
rar su respuesta. 


Las respuestas se localizan al final del capítulo. 

La empresa de publicidad Brandon and Associates, con sede en Atlanta, solicitó a una muestra 
de 1 960 consumidores que probaran un platillo con pollo recién elaborado por Boston Market. De 
las 1 960 personas de la muestra, 1 176 dijeron que comprarían el alimento si se comercializaba. 

a) ¿Qué podría informar Brandon and Associates a Boston Market respecto de la aceptación en la 
población del platillo de pollo? 

b) ¿Es un ejemplo de estadística descriptiva o estadística inferencial? Explique su respuesta. 


1.5 Tipos de variables 

Existen dos tipos básicos de variables: 1) cualitativas y 2) cuantitativas (vea gráfica 1-2). 
Cuando la característica que se estudia es de naturaleza no numérica, recibe el nombre de 
variable cualitativa o atributo. Algunos ejemplos de variables cualitativas son el género, la 
filiación religiosa, tipo de automóvil que se posee, estado de nacimiento y color de ojos. 
Cuando los datos son de naturaleza cualitativa, importa la cantidad o proporción que caen 
dentro de cada categoría. Por ejemplo, ¿qué porcentaje de la población tiene ojos azules? 
¿Cuántos católicos o cuántos protestantes hay en Estados Unidos? ¿Qué porcentaje del total 
de automóviles vendidos el mes pasado eran SUV? Los datos cualitativos se resumen en 
tablas o gráficas de barras (capítulo 2). 
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GRAFICA 1 -2 Resumen de los tipos de variables 


Variable cuantitativa. 


0A5 Describir la diferencia 
entre una variable discreta y 
una variable continua. 


Cuando la variable que se estudia aparece en forma numérica, se le denomina variable 
cuantitativa. Ejemplos de variables cuantitativas son el saldo en su cuenta de cheques, las 
edades de los presidentes de la compañía, la vida de la batería de un automóvil —aproxima- 
damente 42 meses— y el número de hijos que hay en una familia. 

Las variables cuantitativas pueden ser discretas o continuas. Las variables discretas 
adoptan sólo ciertos valores y existen vacíos entre ellos. Ejemplos de variables discretas son 
el número de camas en una casa (1, 2, 3, 4, etc.); el número de automóviles que en una hora 
usan la salida 25, carretera 1-4, en Florida, cerca del Walt Disney World (326, 421, etc.), y el 
número de estudiantes en cada sección de un curso de estadística (25 en la sección A, 42 en 
la sección B y 1 8 en la sección C). Aquí se cuenta, por ejemplo, el número de automóviles que 
arriban a la salida 25, carretera 1-4, y el número de estudiantes de estadística en cada sección. 
Observe que en una casa hay 3 o 4 camas, pero no 3.56. Por consiguiente, existe un vacío 
entre los valores posibles. Las variables discretas son el resultado de una relación numérica. 

Las observaciones de una variable continua toman cualquier valor dentro de un interva- 
lo específico. Ejemplos de variables continuas son la presión del aire en una llanta y el peso 
de un cargamento de tomates. Otros ejemplos son la cantidad de cereal con pasas que con- 
tiene una caja y la duración de los vuelos de Orlando a San Diego. El promedio de puntos al 
graduarse (PPG) constituye una variable continua. Podría expresar el PPG de determinado 
estudiante como 3.2576952. Se acostumbra redondear a 3 lugares decimales (3.258). Por lo 
general las variables continuas son el resultado de mediciones. 


0A6 Distinguir entre los 
niveles de medición de datos. 


1.6 Niveles de medición 



Los datos se clasifican por niveles de medición. El nivel de medición de los 
datos rige los cálculos que se llevan a cabo con el fin de resumir y presentar 
los datos. También determina las pruebas estadísticas que se deben realizar. 
Por ejemplo, en una bolsa de M&M hay lunetas de seis diferentes colores. 
Suponga que asigna el 1 al café, el 2 al amarillo, el 3 al azul, el 4 al naranja, el 
5 al verde y el 6 al rojo. Sume la cantidad de lunetas que hay en una bolsa, la 
divide entre el número de lunetas e informa que el color promedio es 3.56. 
¿Significa que el color promedio es azul o anaranjado? Desde luego que no. 
Otro ejemplo: en la pista de una escuela secundaria hay ocho competidores 
para la carrera de 400 metros. Para indicar el orden en que llegan a la meta 
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Estadística en acción 

¿Dónde tiene sus oríge- 
nes la estadística? En 
1662 John Graunt publi- 
có el artículo “Natural 
and Political Observa- 
tions Made upon Bills of 
Mortality”. Las observa- 
ciones del autor eran el 
resultado del estudio y 
análisis de una publica- 
ción religiosa semanal lla- 
mada Bill of Mortality, la 
cual incluía nacimientos, 
bautizos y muertes junto 
con sus causas. Graunt se 
dio cuenta de que Bills of 
Mortality representaba 
apenas una fracción de 
los nacimientos y muertes 
en Londres. Sin embargo, 
utilizó los datos para lle- 
gar a conclusiones relati- 
vas al efecto de las enfer- 
medades, como la peste, 
en la población. Su lógi- 
ca constituye un ejemplo 
de inferencia estadística. 
Su análisis e interpreta- 
ción de los datos marcan 
el inicio de la estadística. 



dice que la media es de 4.5. ¿Qué revela este promedio? ¡Nada! En ambos casos, no se 
empleó adecuadamente el nivel de medición. 

De hecho, existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. La 
medición más baja, o más primaria, corresponde al nivel nominal. La más alta, o el nivel que 
proporciona la mayor información relacionada con la observación, es la medición de razón. 


Datos de nivel nominal 

En el caso del nivel nominal de medición, las observaciones acerca de una variable cualitati- 
va sólo se clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas. 
La clasificación de los seis colores de las lunetas de chocolate de leche M&M constituye un 
ejemplo del nivel nominal de medición. Simplemente se clasifican las lunetas por color. No 
existe un orden natural. Es decir, no presenta primero las lunetas cafés, las anaranjadas o las 
de cualquier color. El género representa otro ejemplo del nivel nominal de medición. Suponga 
que hace un conteo de los estudiantes que entran a un partido de fútbol con credencial e infor- 
ma cuántos son hombres y cuántas mujeres. Podría presentar primero a los hombres o a las 
mujeres. Para el nivel nominal, la medición consiste en contar. A veces, para una mejor com- 
prensión de lectura, estos conteos se convierten en porcentajes. La siguiente “instantánea” de 
USA Today muestra los resultados de una encuesta entre trabajadores. La variable de interés 
son los “Beneficios”, y hay cinco posibles resultados positivos: “Más dinero”, “Mejor atención 
médica”, “Mejor retiro”, “Balance trabajo/famllia” y, se supone, “Otros”. El resultado “Otros” 
no se muestra en la tabla, pero es necesario para hacer que el porcentaje de encuestados 
sume un total de 100%. No existe un orden natural para los resultados, se puede poner “Mejor 
atención médica” primero en vez de “Más dinero”. 

Para procesar los datos, como la información respecto de los beneficios laborales, o infor- 
mación sobre género, empleos por industria o lugar de nacimiento de un estudiante, a menu- 
do se codifica la información en forma numérica. Esto es, asignamos a los estudiantes de 
Alabama el código 1 , Alaska el código 2, Arizona el 3, y así sucesivamente. Mediante este pro- 
cedimiento, Wlsconsin recibe el código 49 y Wyoming, el 50. Esta codificación facilita el con- 
teo por computadora. Sin embargo, y dado que hemos asignado números a las diversas cate- 
gorías, esto no nos da licencia para manipular los números. Para explicarnos mejor, 1 + 2 no 
es igual a 3; es decir, Alabama + Alaska no da como resultado Arizona. 

Resumiendo, el nivel nominal tiene las siguientes propiedades: 

1 . La variable de interés se divide en categorías o resultados. 

2. No existe un orden natural de los resultados. 


USA TODAY Snapshot 


03/1 5/2007 - actualizada 1 1 :51 PM TE 


Los trabajadores 
dijeron que prefieren 
salarios más altos 
a otros beneficios. 


42% Lo que quieren los empleados 



Por Anne R. Carey y Chad Palmer, USA Today 
Fuente: hudson-index.com 

Reimpreso con autorización (marzo 1 5, 2007) de USA TODAY. 
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Datos de nivel ordinal 

El nivel inmediato superior de datos es el nivel ordinal. La tabla 1-1 contiene las calificacio- 
nes que los alumnos del profesor James Bruner le otorgaron después de un curso de 
Introducción a las finanzas. Cada estudiante de la clase respondió la pregunta: “En términos 
generales, ¿cómo calificas al profesor del curso?” La calificación variable ¡lustra el uso de la 
escala ordinal de medición. Una calificación es más alta o mejor, que la siguiente: superior es 
mejor que bueno, bueno es mejor que promedio, etc. Sin embargo, no es posible distinguir la 
magnitud de las diferencias entre los grupos. ¿La diferencia entre superior y bueno es la misma 
que entre malo e inferior ? No es posible afirmarlo. Si sustituye 5 por superior y 4 por bueno, 
concluirá que la calificación superior es mejor que la calificación bueno, pero si suma una cali- 
ficación de superior y una de bueno no espere que el resultado tenga significado. Además, no 
debe concluir que la calificación de bueno (calificación de 4) sea necesariamente dos veces 
más alta que malo (calificación de 2). Sólo tendrá claro que la calificación bueno es mejor que 
la calificación malo, no en qué grado es mejor. 


TABLA 1 -1 Calificaciones de un profesor de finanzas 


Calificación 

Frecuencia 

Superior 

6 

Bueno 

28 

Promedio 

25 

Malo 

12 

Inferior 

3 


Otro ejemplo de datos de nivel ordinal es el Homeland Security Advisory Sys- 
tem. El Departamento de Seguridad Nacional publica información relativa al riesgo 
de que las autoridades federal, estatal y local, así como los estadounidenses, sean 
víctimas de ataques terroristas. A la izquierda aparecen los primeros cinco niveles 
de riesgo, que van desde el más bajo hasta el más alto y se incluye una descripción 
y códigos de colores. 

Éste es un ejemplo de la escala ordinal, ya que conoce el orden o los grados de 
los niveles de riesgo —el naranja es superior al amarillo — , aunque la diferencia en 
cuanto a riesgo no es necesariamente la misma. En otras palabras, la diferencia 
en cuanto al nivel de riesgo entre el amarillo y el naranja no es la misma que la que 
existe entre el verde y el azul. Consulte los niveles actuales de riesgo y conozca más 
sobre los diversos niveles en la siguiente dirección: www.whltehouse.gov/homeland. 
En resumen, las propiedades del nivel ordinal de los datos son las siguientes: 

1 . Las clasificaciones de los datos se encuentran representadas por conjuntos de 
etiquetas o nombres (alto, medio, bajo), las cuales tienen valores relativos. 

2. En consecuencia, los valores relativos de los datos se pueden clasificar u orde- 
nar. 


Datos de nivel de intervalo 

El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las característi- 
cas del nivel ordinal, pero, además, la diferencia entre valores constituye una magnitud cons- 
tante. Un ejemplo de nivel de intervalo de medición es la temperatura. Suponga que las tem- 
peraturas altas durante tres días consecutivos de invierno en Boston son de 28, 31 y 20 gra- 
dos Fahrenheit. Estas temperaturas se clasifican fácilmente, aunque, además, es posible 
determinar la diferencia entre ellas, gracias a que un grado Fahrenheit representa una unidad 
de medición constante. Diferencias iguales entre dos temperaturas son las mismas, sin impor- 
tar su posición en la escala. Es decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5; la 
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diferencia entre 50 y 55 grados también es de 5. Es importante destacar que 0 es un punto 
más en la escala. No representa la ausencia de estado. Cero grados Fahrenheit no represen- 
ta la ausencia de calor, sino sencillamente el hecho de que hace frío. De hecho, 0 grados 
Fahrenheit equivale aproximadamente a -18 grados en la escala Celsius. 

Otro ejemplo de escala de intervalo de medición consiste en las tallas de ropa para dama. 
En seguida se muestran datos referentes a diversas medidas de una prenda de una mujer cau- 
cásica típica. 


Talla 

Busto (pulgadas) 

Cintura (pulgadas) 

Cadera (pulgadas) 

8 

32 

24 

35 

10 

34 

26 

37 

12 

36 

28 

39 

14 

38 

30 

41 

16 

40 

32 

43 

18 

42 

34 

45 

20 

44 

36 

47 

22 

46 

38 

49 

24 

48 

40 

51 

26 

50 

42 

53 

28 

52 

44 

55 


¿Por qué razón la talla es una medición de intervalo? Observe que conforme la talla cambia 2 
unidades (de la talla 10 a la 12, o de la talla 24 a la 26), cada medida aumenta 2 pulgadas. En 
otras palabras, los intervalos son los mismos. 

No existe un punto cero natural que represente una talla. Una prenda talla cero no está 
hecha de cero material. Más bien, se trata de una prenda con 24 pulgadas de busto, 16 pul- 
gadas de cintura y 27 de cadera. Además, las razones no tienen significado alguno. Si divide 
una talla 28 entre una talla 14, no obtiene la misma respuesta que si divide una talla 20 entre 
una 10. Ninguna razón es igual a dos, como sugeriría el número de talla. En resumen, si las 
distancias entre los números tienen sentido, aunque las razones no, entonces tiene una esca- 
la de intervalo de medición. 

Las propiedades de los datos de nivel de intervalo son las siguientes: 

1 . Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la carac- 
terística en cuestión. 

2. Diferencias iguales en la característica representan diferencias iguales en las mediciones. 


Datos de nivel de razón 

Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de 
razón es el más alto. Posee todas las características del nivel de intervalo, aunque, además, 
el punto 0 tiene sentido y la razón entre dos números es significativa. Ejemplos de la escala de 
razón de medición incluyen salarios, unidades de producción, peso, cambios en los precios 
de las acciones, la distancia entre sucursales y la altura. El dinero ilustra bien el caso. Si tiene 
cero dólares, entonces no tiene dinero. El peso constituye otro ejemplo. Si el cuadrante de la 
escala de un dispositivo correctamente calibrado se ubica en 0, entonces hay una ausencia 
total de peso. La razón entre dos números también resulta significativa. Si Jim gana 40 000 
anuales vendiendo seguros y Rob gana $80 000 al año en el negocio de los automóviles, 
entonces Rob gana el doble de lo que gana Jim. 

La tabla 1 -2, que ilustra el uso de la escala de razón de medición, muestra los ingresos de 
cuatro parejas de padre e hijo. 
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TABLA 1 -2 Combinaciones de ingresos de padre e hijo 


Nombre 

Padre 

Hijo 

Lahey 

$80 000 

$ 40 000 

Nale 

90 000 

30 000 

Rho 

60 000 

120 000 

Steele 

75 000 

130 000 


Observe que Lahey, padre, gana el doble de lo que gana su hijo. En la familia de Rho, el 
hijo percibe el doble de ingresos que su padre. 

En resumen, las propiedades de los datos de nivel de intervalo son las siguientes: 

1 . Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características que 
poseen. 

2. Diferencias iguales en la característica representan diferencias iguales en los números 
asignados a las clasificaciones. 

3. El punto cero representa la ausencia de características y la razón entre dos números es 
significativa. 

La gráfica 1-3 resume las principales características de los diversos niveles de medición. 



GRÁFICA 1-3 


Resumen de las características de los niveles de medición 



¿Cuál es el nivel de medición que reflejan los siguientes datos? 

a) La edad de cada persona en una muestra de 50 adultos que escuchan una de las 1 230 estacio- 
nes de radio que transmiten entrevistas en Estados Unidos es: 
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33 
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b) En una encuesta de 200 propietarios de automóviles de lujo, 100 eran de California, 50 de Nueva 
York, 30 de Illinois y 20 de Ohio. 
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comed 


Ejercicios 

Al final del libro se encuentran las respuestas a los ejercicios Impares. 

1. ¿Cuál es el nivel de medición de cada una de las siguientes variables? 

a) Coeficientes intelectuales de los estudiantes. 

b) La distancia que viajan los estudiantes para llegar a clases. 

c) Los números en los jerseys de un equipo universitario femenino de fútbol. 

d ) Una clasificación de estudiantes por fecha de nacimiento. 

e) Una clasificación de estudiantes que cursan primero, segundo, tercero o último grados. 

f) Número de horas que los alumnos estudian a la semana. 

2. ¿Cuál es el nivel de medición de los siguientes artículos relacionados con el negocio de los perió- 
dicos? 

a) El número de periódicos vendidos todos los domingos durante 201 1 . 

b) Los diferentes departamentos, como edición, publicidad, deportes, etcétera. 

c) Un resumen del número de periódicos vendidos por condado. 

d) Cantidad de años que cada empleado ha laborado en el periódico. 

3. Localice en la última edición de USA Today o en el periódico de su localidad ejemplos de cada 
nivel de medición. Redacte un breve resumen de lo que descubra. 

4. En los siguientes casos determine si el grupo representa una muestra o una población. 

a) Los participantes en el estudio de un nuevo fármaco para el colesterol. 

b) Los conductores que recibieron una multa por exceso de velocidad en la ciudad de Kansas el 
último mes. 

c) Beneficiarios del programa de asistencia social en Cook County (Chicago), Illinois. 

d) Las 30 acciones que forman parte del promedio industrial Dow Jones. 

1.7 Ética y estadística 

Después de eventos tales como el esquema Ponzi del administrador de dinero de Wall Street, 
Bernie Madoff, que estafó miles de millones a los inversionistas, y las distorsiones financieras 
de Enron y Tyco, los estudiantes de administración necesitan comprender que estos aconte- 
cimientos se debieron a la interpretación equivocada de los datos administrativos y financie- 
ros. En cada caso, el personal comunicó a los inversionistas información financiera que indi- 
caba que las compañías se estaban desempeñando mucho mejor de lo que en realidad lo 
hacían. Cuando se presentó la información verdadera, las compañías tenían un valor muy infe- 
rior al que se anunciaba. El resultado fue que muchos inversionistas perdieron todo o casi todo 
el dinero que invirtieron en estas compañías. 

El artículo “Statistics and Ethics: Some Advice for Young Statisticians”, que apareció en 
The American Statistician 57, núm. 1 (2003) (www.amstat.org/profession), proporciona orien- 
tación al respecto. Los autores aconsejan la práctica de la estadística con integridad y hones- 
tidad, e instan a “hacer lo correcto” cuando se recoja, organice, resuma, analice e interprete 
información numérica. La contribución real de la estadística a la sociedad es de naturaleza 
moral. Los analistas financieros necesitan proporcionar información que refleje el verdadero 
desempeño de una compañía, de tal manera que no desorienten a los inversionistas. La infor- 
mación relativa a defectos de un producto que puede ser dañino se debe analizar y darse a 
conocer con integridad y honestidad. Los autores del artículo de The American Statistician 
indicaron, además, que cuando se practique la estadística, es necesario mantener “un punto 
de vista independiente y con principios”. 

Conforme el lector avance, atenderá a cuestiones éticas relacionadas con la recopilación, 
análisis, presentación e interpretación de información estadística. Es de esperarse, asimismo, 
que conforme el lector aprenda más estadística, se convierta en un consumidor crítico. Por 
ejemplo, pondrá en tela de juicio un informe basado en datos que no representan fielmente a 
la población, otro que no contenga estadísticas relevantes, uno que incluya una elección inco- 
rrecta de medidas estadísticas o una presentación de datos tendenciosa en un intento delibe- 
rado por desorientar o tergiversar los hechos. 

1.8 Aplicaciones de la computadora 

En la actualidad las computadoras están disponibles en la mayoría de las escuelas de forma- 
ción profesional y universidades. Las hojas de cálculo, como Microsoft Excel, y los paquetes 
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de software de estadística, como Minitab, se encuentran disponibles en la mayoría de los labo- 
ratorios de computadoras. El paquete Microsoft Excel viene incluido en muchas computado- 
ras domésticas. En el texto se emplea tanto Excel como Minitab para las aplicaciones. 
También se utiliza un complemento de Excel llamado MegaStat, que proporciona a Excel la 
capacidad para generar informes estadísticos adicionales. 

El siguiente ejemplo muestra la aplicación de las computadoras en el análisis estadístico. 
En los capítulos 2, 3 y 4 aparecen los métodos para resumir y describir datos. Un ejemplo que 
se utiliza en dichos capítulos se refiere al precio, expresado en miles de dólares, de 180 ve- 
hículos vendidos el mes pasado por el Applewood Auto Group. La siguiente presentación de 
Excel revela, entre otras cosas, que: 1) se vendieron 180 vehículos el mes pasado; 2) la ganan- 
cia media (promedio) por vehículo fue de $1 843.17; 3) las ganancias iban desde un mínimo 
de $294 hasta un máximo de $3 292. 
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La siguiente captura de pantalla se toma del sistema Minitab; contiene mucha de la misma 
información. 



Si hubiera empleado una calculadora para llegar a estas medidas y otras que se necesi- 
tan para analizar plenamente los precios de venta, se hubieran requerido horas de cálculos. 
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Además, la posibilidad de cometer un error aritmético es alta cuando se maneja una gran can- 
tidad de valores. Por otra parte, los paquetes de software de estadística y las hojas de cálcu- 
lo proporcionan información exacta en segundos. 

Según el criterio de su instructor y dependiendo del sistema de software disponible, ins- 
tamos al lector a utilizar un paquete de computadora para resolver los ejercicios en los Ejer- 
cicios de la base de datos. Ello le evitará tediosos cálculos y le permitirá concentrarse en el 
análisis de datos. 


Resumen del capítulo 

I. La estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de 
facilitar la toma de decisiones más eficaces. 

II. Existen dos clases de estadística. 

A. La estadística descriptiva que consiste en un conjunto de procedimientos para organizar y resu- 
mir datos. 

B. La estadística inferencial implica tomar una muestra de una población y llevar a cabo cálculos 
relativos a ésta sobre la base de los resultados de la muestra. 

1. Una población es un conjunto de individuos u objetos de interés o las medidas que se obtie- 
nen de todos los individuos u objetos de interés. 

2 . Una muestra es una parte de la población. 

III. Existen dos tipos de variables. 

A. Una variable cualitativa es de naturaleza no numérica. 

1. Por lo común, lo que interesa es el número o porcentaje de observaciones en cada cate- 
goría. 

2 . Los datos cualitativos se reúnen en gráficas y diagramas de barras. 

B. Existen dos tipos de variables cuantitativas, que se presentan de forma numérica. 

1. Las variables discretas toman ciertos valores, y existen vacíos entre éstos. 

2 . Una variable continua adopta cualquier valor dentro de un intervalo específico. 

IV. Existen cuatro niveles de medición. 

A. En el caso del nivel nominal, los datos se distribuyen en categorías sin un orden particular. 

B. El nivel ordinal de medición supone que una clasificación se encuentra en un nivel superior a 
otra. 

C. El nivel de medición de intervalo posee la característica de clasificación correspondiente al nivel 
ordinal de medición, además de que la distancia entre valores es constante. 

D. El nivel de medición de razón cuenta con todas las características del nivel de intervalo, además 
de que existe un punto 0 y que la razón entre dos valores resulta significativa. 


comed: 


Ejercicios del capítulo 

5 . Explique la diferencia entre variables cualitativas y cuantitativas. Proporcione un ejemplo de varia- 
ble cuantitativa y otro de variable cualitativa. 

6. Explique la diferencia entre muestra y población. 

7 . Explique la diferencia entre variable discreta y continua. Proporcione un ejemplo de cada una que 
no aparezca en el texto. 

8. En los siguientes problemas indique si recogería información utilizando una muestra o una pobla- 
ción y por qué lo haría. 

a) Estadística 201 es un curso que se imparte en la universidad. El profesor A. Verage ha enseña- 
do a alrededor de 1 500 estudiantes los pasados cinco años. Usted quiere conocer el grado 
promedio de los estudiantes que toman el curso, 
ib) Como parte del proyecto de investigación, usted necesita dar a conocer la rentabilidad de la 
compañía líder en Fortune 500 durante los pasados diez años. 

c) Usted espera graduarse y conseguir su primer empleo como vendedor en una de las cinco prin- 
cipales compañías farmacéuticas. Al hacer planes para sus entrevistas, necesitará conocer la 
misión de la empresa, rentabilidad, productos y mercados. 

d) Usted se encuentra comprando un nuevo reproductor de música MP3, como el ¡Pod de Apple. 
El fabricante anuncia la cantidad de pistas que almacena la memoria. Considere que los anun- 
ciantes toman en cuenta piezas de música popular cortas para calcular la cantidad de pistas 
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que pueden almacenarse. Sin embargo, usted prefiere las melodías de Broadway, que son más 
largas. Usted desea calcular cuántas melodías de Broadway podrá guardar en su reproductor 
MP3. 

9 . Antes, las salidas en las carreteras interestatales se numeraban sucesivamente a partir del borde 
oeste o sur de un estado. Sin embargo, recientemente el Departamento de Transporte cambió 
muchos de estos números para que concordaran con los señalados en los marcadores de millas 
a lo largo de la carretera. 

a) ¿De qué nivel de medición eran los datos sobre los números consecutivos de las salidas? 

b) ¿De qué nivel de medición son los datos sobre los números asentados en los marcadores? 

c) Exponga las ventajas del nuevo sistema. 

10 . Un sondeo solicita a un gran número de estudiantes universitarios que den información sobre las 
siguientes variables: el nombre de su proveedor de servicios de telefonía celular (AT&T, Verizon, 
etc.), los números de minutos que utilizaron durante el último mes (200, 400, por ejemplo) y su nivel 
de satisfacción con el servicio (Terrible, Adecuado, Excelente y así sucesivamente). ¿Cuál es la 
escala de datos para cada una de estas tres variables? 

11. Recientemente, las tiendas Barnes & Noble comenzaron a vender la Nook, un dispositivo median- 
te el cual se pueden descargar electrónicamente más de 1 500 libros, y leerlos en un pequeño 
monitor en vez de comprarlos. Asuma que usted tiene el número de Nook vendidas cada día 
durante el último mes, en la tienda de Barnes & Noble del Market Commons Malí en Riverside, 
California. Describa una condición en la que esta información podría ser considerada una mues- 
tra. Ejemplifique una segunda situación en la que los mismos datos podrían ser considerados una 
población. 

12 . Utilice los conceptos de muestra y población para describir por qué una elección presidencial no 
es igual a una encuesta “de salida” del electorado. 

13 . Ubique las variables en las siguientes tablas de clasificación. Resuma en cada tabla sus observa- 
ciones y evalúe si los resultados son verdaderos. Por ejemplo, el salario se presenta como una 
variable cuantitativa continua. También es una variable de escala de razón. 

a) Salario 
£>) Género 

c) Volumen de ventas de reproductores MP3 

d) Preferencia por los refrescos 

e) Temperatura 

f) Resultados del Salvation Attitude Test (SAT)* 

g) Lugar que ocupa un estudiante en clase 

h) Calificaciones de un profesor de finanzas 

i) Cantidad de computadoras domésticas 


Variable discreta Variable continua 

Cualitativa 



Cuantitativa 


a) Salario 



Discreta 

Continua 

Nominal 



Ordinal 



Intervalo 



Razón 


a) Salario 


* N. del E. El SAT es un examen propuesto por E.D. Hirsch, quien argumentaba que de nada servían las téc- 
nicas pedagógicas en boga si los estudiantes no contaban con un bagaje de conocimientos que fundamen- 
taran su aprendizaje. 
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14. A partir de los datos de publicaciones como Statistical Abstract of the United States, The World 
Almanac, Forbes o del periódico local, proporcione ejemplos de los niveles de medición nominal, 
ordinal, de intervalo y de razón. 

15. Struthers Wells Corporation emplea a más de 10 000 empleados administrativos en sus oficinas 
de ventas y fabricación en Estados Unidos, Europa y Asia. Una muestra de 300 de esos emplea- 
dos reveló que 1 20 aceptarían ser transferidos fuera de Estados Unidos. Con base en estos hallaz- 
gos, redacte un breve memorando dirigido a la señora Wanda Cárter, vicepresidenta de Recursos 
Humanos, relacionado con los empleados administrativos de la firma y su disposición para que se 
les reubique. 

16. AVX Stereo Equipment, Inc., recién comenzó a aplicar una política de devolución de artículos sin 
complicaciones. Una muestra de 500 clientes que recién habían devuelto artículos mostró que 400 
pensaban que la política era justa, 32 opinaban que requería mucho tiempo llevar a cabo la trans- 
acción y el resto no opinó. De acuerdo con dicha información, haga una inferencia sobre la reac- 
ción del consumidor ante ia nueva política. 

17. La siguiente tabla contiene el número de automóviles y camiones de carga ligera vendidos por los 
ocho principales fabricantes de automóviles en los primeros dos meses de 201 0, comparados con 
el mismo periodo de 2009. 


Fabricante 

Ventas en lo que va del año 

Febrero 

2010 

Febrero 

2009 

General Motors Corp. 

287 242 

252 701 

Ford Motor Company 

249 514 

185 825 

Chrysler LLC 

141 592 

146 207 

Toyota Motor Sales USA Inc. 

198 823 

226 870 

American Honda Motor Co. Inc. 

148 150 

142 606 

Nissan North America Inc. 

132 761 

108 133 

Hyundai Motor America 

64 507 

55 133 

Mazda Motor of America Inc. 

32 748 

31 821 


a) Compare el total de ventas de los ocho fabricantes. ¿Ha habido un decremento o un aumento 
en las ventas de 2010 con respecto ai mismo periodo de 2009? 

b) Calcule el porcentaje de mercado que posee cada compañía. 

c) Compare el incremento del porcentaje de cada una de las ocho compañías. ¿Qué cambios sig- 
nificativos ocurrieron en cada una de 2009 a 2010? 

18. La siguiente gráfica describe las cantidades promedio gastadas por los consumidores en regalos 
de Navidad. 
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Redacte un breve informe que resuma las cantidades gastadas durante la temporada navideña. 
Asegúrese de incluir el total de gastos, así como el porcentaje que corresponde a cada grupo. 
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19 . La siguiente gráfica representa las utilidades en millones de dólares de ExxonMobil en el periodo 
que va de 2003 a 2009. ¿Fueron más altas en un año que en los otros? ¿Las ganancias aumenta- 
ron, se redujeron o permanecieron sin cambios durante el periodo? 
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Ejercicios de lo base de datos 

20 . Remítase a los datos sobre el sector inmobiliario que aparecen en el texto, que incluyen informa- 
ción sobre casas vendidas en la zona de Goodyear, Arizona, el año pasado. Considere las siguien- 
tes variables: precio de venta, número de recámaras, ubicación y distancia al centro de la ciudad. 

a) De las variables, ¿cuáles son cualitativas y cuáles cuantitativas? 

b) Determine el nivel de medición de cada una de las variables. 

21 . Consulte los datos sobre Baseball 2009, que contienen información de los treinta equipos de las 
Ligas Mayores de Béisbol durante la temporada 2009. Considere las siguientes variables: número 
de victorias, salario del equipo, asistencia durante la temporada, si el equipo jugó los partidos 
como anfitrión sobre césped, pasto sintético o superficie artificial, así como el número de carreras 
anotadas. 

a) ¿Cuáles de estas variables son cuantitativas y cuáles cualitativas? 

b) Determine el nivel de medición de cada una de las variables. 

22 . Remítase a los datos de Buena School District, que reportan información sobre la flota de autobu- 
ses en el distrito escolar. 

a) ¿Cuáles de las variables son cuantitativas y cuáles cualitativas? 
ib) Determine el nivel de medición de cada una de ellas. 
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Capítulo 1 


Respuestas a las autoevaluaciones 



1-1 a) Sobre la base de la muestra de 1 960 consumidores, 
estimamos que, si lo comercializa, 60% de ellos com- 
prará el platillo de pollo (1 176/1 960) X 100 = 60%. 
b) Estadística inferencial, ya que se empleó una muestra 
para llegar a una conclusión relativa a la reacción de 
los consumidores de la población en caso de que se 
comercializara el platillo de pollo. 


1-2 a) La edad es una variable de escala de razón. Una per- 
sona de 40 años tiene el doble de edad que una de 
20 . 

b) Escala nominal. Podría ordenar indistintamente los 
estados. 



Descripción de datos 

Tablas de frecuencias, distribuciones de 
frecuencias y su representación gráfica 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



Merrill Lynch recién concluyó el estudio de una cartera de inversiones 
en línea para una muestra de clientes. Elabore una distribución de 
frecuencias con los datos de los 70 participantes en el estudio (vea 
ejercicio 43 y objetivo 4). 



OA1 Hacer una tabla de 
frecuencias a partir de un 
grupo de datos. 

OA2 Organizar los datos 
cualitativos en una gráfica de 
barras. 

OA3 Presentar un grupo de 
datos como una gráfica de 
pastel. 

OA4 Crear una distribución 
de frecuencias de un grupo de 
datos. 

OA5 Comprender una 
distribución de frecuencias 
relativas. 

OA6 Representar una 
distribución de frecuencias de 
datos por medio de 
histogramas o polígonos de 
frecuencia. 

OA7 Construir e interpretar 
una distribución de frecuencia 
acumulativa. 


CAPÍTULO 2 Descripción de datos: tablas de frecuencias 


2.1 Introducción 



El altamente competitivo negocio de la venta de automóviles al menudeo en 
Estados Unidos ha sufrido un cambio significativo durante los últimos años. 
Estos cambios desataron eventos como: 

• Las quiebras de General Motors y Chrysler en 2009. 

• La eliminación de marcas bien conocidas, como Pontiac y Saturno. 

• El cierre de más de 1 500 distribuidoras locales. 

• El colapso de la disponibilidad de créditos al consumidor. 

• La consolidación de grupos de concesionarias. 


^ ■ Por tradición, una familia local poseía y manejaba la concesionaria de la 

comunidad, que pudo haber incluido a uno o dos fabricantes, como Pontiac y 
GMC Trucks o Chrysler y la popular línea Jeep. Sin embargo, compañías hábilmente adminis- 
tradas y bien financiadas han adquirido recientemente las concesionarias locales en extensas 
regiones de ese país. Al adquirirlas, estos grupos traen consigo sus prácticas de venta acos- 
tumbradas, plataformas tecnológicas comunes de software y hardware, y técnicas de presen- 
tación de informes administrativos. El objetivo consiste en proporcionar al consumidor una 
mejor experiencia de compra, mientras se incrementa la rentabilidad. Con frecuencia, estas 
megaconcesionarias emplean alrededor de diez mil personas, que generan varios miles de 
millones de dólares en ventas anuales, poseen más de cien franquicias y se cotizan en la Bolsa 
de Valores de Nueva York o NASDAQ. Hoy en día, la megaconcesionaria más grande es 
AutoNation (símbolo bursátil AN). Otros incluyen Penske Auto Group (PAG y la segunda más 
grande), Asbury Automotive Group (ABG) y Hendrick Auto Group (empresa privada). 

El Applewood Auto Group comprende cuatro concesionarias. El grupo vende una amplia 
gama de vehículos, entre ellas las marcas económicas de importación Kia y Hyundai, la línea 
de alta calidad de sedanes BMW y Mercedes Benz y una línea completa de automóviles y 
camiones Ford y Chevrolet. 

La señora Kathryn Ball es miembro del equipo de alta gerencia de Applewood Auto Group, 
cuyas oficinas corporativas son adyacentes a Hilltop Motors. Es responsable de rastrear y 
analizar los precios de venta y la rentabilidad de los vehículos. A ella le gustaría resumir las 
ganancias obtenidas de la venta de los vehículos en tablas y gráficas que pudiese revisar cada 
mes. A partir de estas tablas y gráficas desea conocer la ganancia por vehículo vendido, así 
como las ganancias más bajas y más altas. Además, está interesada en describir el perfil 
demográfico de los compradores. ¿Qué edades tienen? ¿Cuántos vehículos han adquirido 
previamente de una de las distribuidoras de Applewood? ¿Qué tipo de vehículo compraron? 

El Applewood Auto Group opera cuatro distribuidoras: 
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• Tionesta Ford Lincoln Mercury vende auto- 
móviles y camiones Ford, Lincoln y Mercury. 

• Olean Automotive Inc. tiene la franquicia de 
Nissan y las marcas Chevrolet, Cadillac y 
camiones GMC. 

• Sheffield Motors Inc. vende Buick, camio- 
nes GMC, Hyundai y Kia. 

• Hilltop Motors ofrece Chrysler, Dodge y la 
línea Jeep, así como BMW y Volvo. 

Cada mes, la señora Ball recaba datos de 
cada una de las cuatro concesionarias y los ingre- 
sa en una hoja de cálculo de Excel. El último mes, 
Applewood Auto Group vendió 180 vehículos en 
sus cuatro distribuidoras. Una copla de sus pri- 
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meras observaciones aparece en la parte inferior de la página anterior. Las variables que reco- 
piló son: 

Ganancia-, la cantidad que obtuvo la distribuidora por la venta de cada vehículo. 

• Edad: la edad del comprador en el momento de la compra. 

• Locación: la distribuidora donde fue adquirido el vehículo. 

• Tipo de vehículo: SUV, sedán, compacto, híbrido o camión. 

• Previo: número de vehículos previamente comprados por el consumidor en cualquiera de 
las cuatro distribuidoras Applewood. 

El conjunto completo de datos se encuentra disponible en el sitio web de McGraw-Hill y en el 
apéndice A.5, que se ubica al final del libro. 

2.2 Construcción de una tabla de frecuencias 

Recuerde que, en el capítulo 1, al grupo de técnicas que se utilizan para describir un conjun- 
to de datos se les denominó estadística descriptiva. En otras palabras, la estadística descrip- 
tiva se encarga de organizar datos con el fin de mostrar la distribución general de éstos y el 
lugar en donde tienden a concentrarse, además de señalar valores de datos poco usuales o 
extremos. El primer procedimiento que se emplea para organizar y resumir un conjunto de 
datos es una tabla de frecuencias. 


TABLA DE FRECUENCIAS Agrupación de datos cualitativos en clases mutuamente excluyentes 
que muestra el número de observaciones en cada clase. 


0A1 Hacer una tabla de 
frecuencias a partir de un 
grupo de datos. 



En el capítulo 1 se distingue entre variables cualitativas y cuantitativas. Para recordar, una 
variable cualitativa es de naturaleza no numérica; es decir, que la información es clasificable 
en distintas categorías. No hay un orden particular en estas categorías. Ejemplos de datos 
cualitativos incluyen la afiliación política (demócrata, conservador, independiente), el lugar de 
nacimiento y el método de pago al comprar en Barnes and Noble (efectivo, cheque o cargo a 
tarjeta de crédito). Por otra parte, las variables cuantitativas son de índole numérica. Ejemplos 
de datos cuantitativos relacionados con estudiantes universitarios incluyen el precio de los 
libros de texto, edad y horas que pasan estudiando cada semana del semestre. 

En los datos de Applewood Auto Group existen cinco variables para cada venta de ve- 
hículo: la edad del comprador, monto de la ganancia, distribuidora que hizo la venta, tipo 
de vehículo vendido y número de compras previas del consumidor. La distribuidora y el tipo de 
vehículo son variables cualitativas. El monto de la ganancia, la edad del com- 
prador y el número de compras previas son variables cuantitativas. 

Suponga que la señora Ball desea resumir las ventas del mes pasado por 
locación. Para resumir estos datos cualitativos, clasifique los vehículos que se 
vendieron el mes pasado de acuerdo con la concesionaria: Tionesta, Olean, 
Sheffield o Hilltop. Utilice la concesionaria para elaborar una tabla de frecuen- 
cias con cuatro clases mutuamente excluyentes (distintivas), lo cual significa 
que un vehículo no puede pertenecer a dos de ellas. Cada vehículo se clasifi- 
ca sólo en una de las cuatro concesionarias mutuamente excluyentes. La tabla 
2-1 es la tabla de frecuencias. El número de observaciones, que representa las 
ventas en cada local, recibe el nombre de frecuencia de clase. En este caso, 
la frecuencia de clase de los vehículos que se vendieron en la locación Kanees 
es 52. 


Frecuencias relativas de clase 

Es posible convertir las frecuencias de clase en frecuencias relativas de clase para mostrar la 
fracción del número total de observaciones en cada una de ellas. Así, una frecuencia relativa 
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OA2 Organizar los datos 
cualitativos en una gráfica de 
barras. 


TABLA 2-1 Tabla de frecuencias de los vehículos que vendió Applewood Auto Group por locación 


Locación 

Número de autos 

Kane 

52 

Olean 

40 

Sheffield 

45 

Tionesta 

43 

Total 

180 


capta la relación entre la totalidad de elementos de una clase y el número total de observacio- 
nes. En el ejemplo de la venta de vehículos se podría desear conocer el porcentaje de auto- 
móviles vendidos en cada uno de los cuatro locales. Para convertir una distribución de fre- 
cuencias en una distribución de frecuencias relativa, cada una de las frecuencias de clase se 
divide entre el total de observaciones. Por ejemplo, la fracción de vehículos que se vendieron 
el mes pasado en Kane es de 0.289, que se obtiene al dividir 52 entre 180. La distribución de 
frecuencias relativas de cada locación aparece en la tabla 2-2. 


TABLA 2-2 Tabla de frecuencias relativas de vehículos vendidos por tipo de vehículo en Applewood 
Auto Group el mes pasado 


Locación 

Número de autos 

Frecuencia relativa 

Kane 

52 

0.289 

Olean 

40 

0.222 

Sheffield 

45 

0.250 

Tionesta 

43 

0.239 

Total 

180 

1.000 


Representación gráfica de datos cualitativos 

El instrumento más común para representar una variable cualitativa en forma gráfica es la grá- 
fica de barras. En la mayoría de los casos, el eje horizontal muestra la variable de interés y el 
eje vertical la frecuencia o fracción de cada uno de los posibles resultados. Una característica 
distintiva de esta herramienta es que existe una distancia o espacio entre las barras. Es decir, 
que como la variable de interés es de naturaleza cualitativa, las barras no son adyacentes. Por 
consiguiente, una gráfica de barras es una representación gráfica de una tabla de frecuencias 
mediante una serie de rectángulos de anchura uniforme, cuya altura corresponde a la frecuen- 
cia de clase. 


GRÁFICA DE BARRAS En ella, las clases se representan en el eje horizontal y la frecuencia de 
clase en el eje vertical. Las frecuencias de clase son proporcionales a las alturas de las 
barras. 

V y 


Utilice como ejemplo los datos de Applewood Auto Group (gráfica 2-1). La variable de 
interés es el local donde fue vendido el vehículo y la frecuencia de clase, el número de ve- 
hículos que se vendieron en cada uno de ellos. Represente los cuatro locales sobre el eje hori- 
zontal y el número de vehículos sobre el eje vertical. La altura de las barras, o rectángulos, 
corresponde a la cantidad de vehículos que se vendieron en cada local. En Kane, el mes pasa- 
do se vendieron 52 vehículos, así que la altura de la barra de Kane es 52; la altura de la barra 
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OA3 Presentar un grupo de 
datos como una gráfica de 
pastel. 



GRÁFICA 2-1 Vehículos vendidos en cada local 


de Olean es 40. La variable “local” es de escala nominal, así que no importa el orden de los 
locales sobre el eje horizontal. También puede ser apropiado enlistar esta variable alfabética- 
mente o mediante algún otro tipo de categorización geográfica. 

Otro tipo de gráfica útil para describir información cualitativa es la gráfica de pastel. 


GRÁFICA DE PASTEL Gráfica que muestra la parte o porcentaje que representa cada clase del 
total de números de frecuencia. 


Se explican los detalles de construcción de una gráfica de pastel empleando la información de 
la tabla 2-3, la cual muestra una caída de los gastos de la lotería del estado de Ohio en 2009. 


TABLA 2-3 Gastos de la lotería del estado de Ohio en 2009 


Uso del dinero 
de las ventas 

Cantidad 

(millones de dólares) 

Porcentaje 
de ventas 

Premios 

1 460.0 

60 

Educación 

702.3 

29 

Bonos 

150.0 

6 

Gastos 

124.3 

5 

Total 

2 436.6 

100 


El primer paso para elaborar una gráfica de pastel consiste en registrar los porcentajes 0, 
5, 10, 15, etc., de manera uniforme alrededor de la circunferencia de un círculo (vea gráfica 
2-2). Para indicar la parte de 60% destinada a premios, trace una línea del centro del círculo 
a 0, y otra línea del centro del círculo a 60%. El área de esta rebanada representa lo que se 
recaudó y se destinó a premios. En seguida sume 60% de gastos en premios a 29% de gas- 
tos en educación; el resultado es 89%. Trace una línea del centro del círculo a 89%; de esta 
manera el área entre 60 y 89% señala los gastos en educación. A continuación, sume 6% en 
bonos, lo cual da un total de 95%. Trace una línea del centro del círculo a 95%; así, la reba- 
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GRÁFICA 2-2 Gráfica de pastel de los gastos de la lotería del estado de Ohio en 2009 


nada entre 89 y 95% representa los pagos en bonos. El restante 5% corresponde a gastos de 
operación. 

Dado que cada rebanada de pastel representa la porción relativa de cada componente, es 
posible compararlas con facilidad: 

• El gasto más cuantioso de la lotería de Ohio se canaliza hacia premios. 

• Cerca de una tercera parte de los fondos recaudados se transfieren a educación. 

• Los gastos de operación apenas significan 5% de los fondos recaudados. 

Es posible utilizar un software para elaborar con rapidez una gráfica de pastel visualmen- 
te atractiva e informativa. La siguiente gráfica usa la información de la tabla 2-3 para represen- 
tar los usos de los gastos de la Lotería de Ohio en 2009. 
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Las gráficas de pastel y las de barras cumplen casi la misma función. ¿Cuáles son los cri- 
terios para elegir una u otra? En la mayoría de los casos, las gráficas de pastel son las más 
informativas cuando se trata de comparar la diferencia relativa en el porcentaje de observacio- 
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nes de cada una de las variables de la escala nominal. Es preferible usar una gráfica de barras 
cuando el objetivo es comparar el número de observaciones en cada categoría. 


Cjemplo 


SkiLodges.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber con 
qué facilidad se navega en su diseño de página web. Selecciona al azar 200 usuarios frecuen- 
tes de internet y les pide que lleven a cabo una búsqueda en la página web. A cada uno de 
ellos le solicita que califique la relativa facilidad para navegar como mala, buena, excelente o 
sobresaliente. Los resultados aparecen en la siguiente tabla: 


Sobresaliente 

102 

Excelente 

58 

Buena 

30 

Mala 

10 


1 . ¿Qué tipo de escala de medición se emplea para facilitar la navegación? 

2. Elabore una gráfica de barras con los resultados de la encuesta. 

3. Construya una gráfica de pastel con los resultados de la encuesta. 


Solución 


Los datos se miden de acuerdo con una escala ordinal. Es decir, que la escala se gradúa en 
conformidad con la facilidad relativa y abarca de malo a sobresaliente. Además, se desconoce 
el intervalo entre cada calificación, así que resulta imposible, por ejemplo, concluir que una 
buena calificación representa el doble de una mala calificación. 

Es posible usar una gráfica de barras para representar los datos. La escala vertical mues- 
tra la frecuencia relativa y la horizontal, los valores relativos a la escala de facilidad de navega- 
ción. 


Facilidad de navegación de la página web de SkiLodges.com 
60 



Facilidad de navegación 


También se emplea una gráfica de pastel para representar estos datos. La gráfica de pastel 
hace hincapié en que más de la mitad de los encuestados calificaron de sobresaliente la rela- 
tiva facilidad para utilizar el sitio web. 
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1 



r 


Autoevaluación 2-1 



Las respuestas se localizan al final del capítulo. 

DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor adicional, 
Cola-Plus, muy popular entre sus clientes. La compañía se encuentra interesada en la preferencia 
de los consumidores por Cola-Plus en comparación con Coca-Cola, Pepsi y una bebida de lima- 
limón. Se pidió a 100 consumidores seleccionados de forma aleatoria que degustaran una prueba y 
eligieran la bebida que más les gustaba. Los resultados aparecen en la siguiente tabla: 


Bebida 

Número 

Cola-Plus 

40 

Coca-Cola 

25 

Pepsi 

20 

Lima-limón 

15 

Total 

100 


a) ¿Son los datos de naturaleza cuantitativa o cualitativa? ¿Por qué razón? 

b) ¿Qué nombre recibe la tabla? ¿Qué muestra la tabla? 

c) Diseñe una gráfica de barras para describir la información. 

d) Construya una gráfica de pastel utilizando las frecuencias relativas. 


comed: 


Ejercicios 

Las respuestas a los ejercicios impares se encuentran al final del libro. 

1. Una gráfica de pastel muestra la porción relativa de mercado de los productos de cola. La 
“rebanada” de Pepsi-Cola tiene un ángulo central de 90 grados. ¿Cuál es su porción del mer- 
cado? 

2. En un estudio de mercado se pidió a 100 consumidores que seleccionaran el mejor reproduc- 
tor musical digital entre ¡Pod, iRiver y Magic Star MP3. Con la finalidad de resumir las respues- 
tas de los consumidores en una tabla de frecuencias, ¿cuántas clases debería tener ésta? 

3. Se preguntó a un total de 1 000 residentes de Minnesota qué estación del año preferían. Los 
resultados fueron que a 100 les gustaba más el invierno; a 300, la primavera; a 400, el verano 
y a 200, el otoño. Si se resumieran los datos en una tabla de frecuencias, ¿cuántas clases serían 
necesarias? ¿Cuáles serían las frecuencias relativas de cada clase? 

4. Se preguntó a dos mil viajeros de negocios frecuentes de Midwestern qué ciudad de la región 
central de Estados Unidos preferían: Indianápolis, San Luis, Chicago o Milwaukee. A 100 les 
gustaba más Indianápolis; a 450, San Luis; a 1 300, Chicago, y el resto prefería Milwakee. Ela- 
bore una tabla de frecuencias y una tabla de frecuencias relativas para resumir esta información. 
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OA4 Crear una distribución 
de frecuencias de un grupo 
de datos. 


5. Wellstone, Inc., produce y comercializa fundas para teléfonos celulares en una variedad de colo- 
res. A la compañía le gustaría circunscribir sus planes de producción a cinco diferentes colores: 
blanco brillante, negro metálico, lima magnético, naranja tangerina y rojo fusión. En consecuencia, 
montó un quiosco en el Malí of America por varias horas y preguntó, a personas elegidas de forma 
aleatoria, qué color de funda era su favorito. Los resultados fueron los siguientes: 


Blanco brillante 

130 

Negro metálico 

104 

Lima magnético 

325 

Naranja tangerina 

455 

Rojo fusión 

286 


a) ¿Qué nombre recibe la tabla? 

b) Elabore una gráfica de barras para la tabla. 

c) Dibuje una gráfica de pastel. 

d) Si Wellstone, Inc., tiene planes de producir un millón de fundas para teléfonos celulares, 
¿cuántas de cada color debería producir? 

6. Un pequeño negocio de consultoría investiga el desempeño de diversas compañías. Las ventas 
del cuarto trimestre del año pasado (en miles de dólares) de las compañías seleccionadas fueron 
las siguientes: 


Compañía 

Ventas del cuarto trimestre 
(miles de dólares) 

Hoden Building Products 

$ 1 645.2 

J & R Printing Inc. 

4 757.0 

Long Bay Concrete Construction 

8 913.0 

Mancell Electric and Plumbing 

627.1 

Maxwell Heating and Air Conditioning 

24 612.0 

Mizelle Roofing & Sheet Metals 

191.9 


La consultora desea incluir una gráfica en su informe, para comparar las ventas de seis com- 
pañías. Utilice una gráfica de barras para comparar las ventas del cuarto trimestre de estas 
empresas y redacte un breve informe que resuma la gráfica de barras. 

2.3 Construcción de distribuciones 
de frecuencias: datos cuantitativos 

En el capítulo 1 y al principio de éste se ha distinguido entre datos cualitativos y cuantitativos. 
En la sección anterior, utilizando datos de Applewood Auto Group, aparece un resumen de la 
variable cualitativa —local de la venta— mediante una tabla de frecuencias, una tabla de fre- 
cuencias relativas y una gráfica de barras. 

Los datos de Applewood Auto Group también incluyen variables cuantitativas: la edad del 
comprador, la ganancia que se obtuvo por la venta del vehículo y el número de compras pre- 
vias. Suponga que la señora Ball desea resumir las ventas del último mes utilizando ganancia 
por venta; en este caso, describirá la ganancia de venta por medio de una distribución de fre- 
cuencias. 


DISTRIBUCIÓN DE FRECUENCIAS Agrupación de datos en clases mutuamente excluyentes, que 
muestra el número de observaciones que hay en cada clase. 

¿Cómo crear una distribución de frecuencias? El primer paso consiste en acomodar los 
datos en una tabla que muestre las clases y el número de observaciones que hay en cada 
clase. Los pasos para construir una distribución de frecuencias se entienden mejor con un 
ejemplo. Recuerde que el objetivo es construir tablas, diagramas y gráficas que revelen rápi- 
damente la concentración, los valores extremos y la distribución de los datos. 
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Cjemplo 


Solución 


Pasos para organizar datos 
como distribución de fre- 
cuencias. 


Regrese a la situación en que la señora Kathryn Ball, de AutoUSA, desea tablas, diagramas y 
gráficas para mostrar el precio típico de venta en diversas concesionarias. La tabla 2-4 contie- 
ne la ganancia de cada uno de los 180 vehículos que se vendieron el mes pasado en 
Applewood Auto Group. ¿Cuál es la ganancia típica de cada venta? ¿Cuál es la ganancia más 
alta'? ¿Cuál la ganancia más baja ? ¿Alrededor de qué valor tienden a acumularse las ganan- 
cias? 



La tabla 2-4 muestra las ganancias que generaron las 180 ventas. Nos referimos a esta infor- 
mación desorganizada como datos en bruto o datos no agrupados. Con un poco de búsque- 
da podemos encontrar la ganancia más baja ($294) y la más alta ($3 292), pero eso es todo. 
Resulta difícil determinar una ganancia típica. También se complica la visualización del punto 
donde las ganancias tienden a acumularse. Los datos en bruto se interpretan con mayor faci- 
lidad si se organizan como una distribución de frecuencias. 

Paso 1: Defina el número de clases. El objetivo consiste en emplear suficientes agrupamien- 
tos o clases, de manera tal que se perciba la forma de la distribución. Aquí se nece- 
sita criterio. Una gran cantidad de clases o muy pocas podrían no permitir ver la con- 
formación fundamental del conjunto de datos. En el ejemplo de la ganancia por venta 
de vehículo, tres clases no darían mucha información sobre el patrón de los datos (vea 
tabla 2-5). 


TABLA 2-5 Ejemplo de muy pocas clases 


Ganancia por vehículo (dólares) 

Número de vehículos 

$ 200 a $1 400 

42 

1 400 a 2 600 

115 

2 600 a 3 800 

23 

Total 

180 


Una receta útil para determinar la cantidad de clases [k) es la regla de 2 a la k. Esta 
guía sugiere que se elija el menor número (k) para el número de clases, de tal manera 
que 2 k (en palabras, dos elevado a la /r-ésima potencia) sea mayor que el número de 
observaciones (n). En el ejemplo de Applewood Auto Group se habían vendido 180 
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Estadística en acción 

En 1788, James Madison, 
John Jay y Alexander 
Hamilton publicaron 
anónimamente una serie 
de ensayos titulados The 
Federalist. Estos docu- 
mentos constituían un 
intento para convencer a 
la gente de Nueva York de 
que era necesario ratificar 
la Constitución. En el 
transcurso de la historia, 
se llegó a conocer a los 
autores de estos documen- 
tos, aunque doce perma- 
necieron en el anonimato. 
A través del análisis esta- 
dístico y, en particular, 
del estudio de la frecuen- 
cia con la que se utilizan 
varias palabras, ahora 
podemos concluir que 
James Madison es el pro- 
bable autor de los doce 
documentos. En realidad, 
la evidencia estadística de 
que Madison es el autor 
es abrumadora. 


vehículos. Así que n = 1 80. Si supone que k = 7, lo cual significa que utilizará siete cla- 
ses, entonces 2 7 = 128, algo menos que 180. De ahí que 7 no represente suficientes 
clases. Si k = 8, entonces 2 8 = 256, que es mayor que 180. Por lo tanto, el número de 
clases que se recomienda es de 8. 

Paso 2: Determine el intervalo o ancho de clase. El intervalo o ancho de clase debería ser 
el mismo para todas las clases. Todas las clases juntas deben cubrir por lo menos la 
distancia del valor más bajo al más alto de los datos. Expresado esto en una fórmula 
sería: 


H - L 


en la que i es el intervalo de clase; H, el máximo valor observado; L, el mínimo valor 
observado, y k, el número de clases. 

En el caso de Applewood Auto Group, el valor más bajo es $294 y el más alto, 
$3 292. Si necesitamos 8 clases, el intervalo debería ser por lo menos 

= $ 3 292 - $294 75 

k 8 

En la práctica, por lo general este tamaño de intervalo se redondea a una cifra conve- 
niente, tal como un múltiplo de 1 0 o 1 00. En este caso, el valor de $400 podría emplear- 
se sin inconvenientes. 

En las distribuciones de frecuencia son preferibles los intervalos de clase iguales. 
Sin embargo, en ciertos casos se necesita que no lo sean para evitar una gran canti- 
dad de clases vacías, o casi vacías. Es el caso de la tabla 2-6, el Internal Revenue 
Service de Estados Unidos utilizó intervalos de clase de diferente tamaño para infor- 
mar el ingreso bruto ajustado sobre declaraciones de impuestos. De haber utilizado 
intervalos del mismo tamaño, de $1 000, se habrían requerido más de 1 000 clases 
para representar todos los impuestos. Una distribución de frecuencias de 1 000 cla- 
ses sería difícil de interpretar. En este caso la distribución resulta fácil de entender a 
pesar de las clases desiguales. Observe que en esta tabla en particular, el número de 
declaraciones de impuestos sobre la renta o frecuencias se presenta en miles de uni- 
dades. Esto también facilita la comprensión de la información. 


TABLA 2-6 


Ingreso bruto ajustado de personas que presentan declaraciones del impuesto 
sobre la renta 


Número de declaraciones 


Ingreso bruto ajustado (en miles) 


Ingreso bruto no ajustado 



178.2 

$ 

1 

a 

$ 5 

000 

1 

204.6 

5 

000 

a 

10 

000 

2 

595.5 

10 

000 

a 

15 

000 

3 

142.0 

15 

000 

a 

20 

000 

3 

191.7 

20 

000 

a 

25 

000 

2 

501.4 

25 

000 

a 

30 

000 

1 

901.6 

30 

000 

a 

40 

000 

2 

502.3 

40 

000 

a 

50 

000 

1 

426.8 

50 

000 

a 

75 

000 

1 

476.3 

75 

000 

a 

100 

000 


338.8 

100 

000 

a 

200 

000 


223.3 

200 

000 

a 

500 

000 


55.2 

500 

000 

a 

1 000 

000 


12.0 

1 000 

000 

a 

2 000 

000 


5.1 

2 000 

000 

a 

10 000 

000 


3.4 

10 000 

000 

o más 




0.6 
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Paso 3: Establezca los límites de cada clase. Este paso es importante para que sea posible 
incluir cada observación en una sola categoría. Esto significa que debe evitar la super- 
posición de límites de clase confusos. Por ejemplo, clases como $1 300-$1 400 y 
$1 400-$1 500 no deberían emplearse porque no resulta claro si el valor de $1 400 per- 
tenece a la primera o a la segunda clases. Las clases como $1 300-$1 400 y $1 500- 
$1 600 se emplean con frecuencia, aunque también pueden resultar confusas si no se 
conviene en redondear todos los datos de $1 450 o por arriba de esta cantidad a la 
segunda clase y los datos por debajo de $1 400 a la primera clase. En este libro se 
emplea el formato de $1 300 hasta $1 400 y de $1 400 hasta $1 500 y así sucesiva- 
mente. Con este formato resulta claro que $1 399 pertenece a la primera clase y 
$1 400 a la segunda. 

Al redondear el intervalo de clase hacia arriba con el fin de obtener un tamaño 
conveniente de clase, se cubre un rango más amplio que el necesario. Por ejemplo, 8 
clases de $400 de amplitud en el caso de Applewood Auto Group dan como resulta- 
do un rango de 8($400) = $3 200. El rango real es de $2 998, calculado mediante la 
operación $3 292 - $294. Al comparar este valor con $3 200, hay un excedente de 
$202. Como sólo necesita abarcar la distancia ( H - L), resulta natural poner cantida- 
des aproximadamente iguales al excedente en cada una de las dos colas. Por supues- 
to, también se deberían elegir límites convenientes de clase. Una directriz consiste en 
convertir el límite inferior de la primera clase en un múltiplo del intervalo de clase. A 
veces esto no es posible, pero el límite inferior por lo menos debe redondearse. Ahora 
bien, éstas son las clases que podría utilizar para estos datos: 


Clases 


$ 

200 

a $ 


600 


600 

a 

i 

000 

1 

000 

a 

i 

400 

1 

400 

a 

i 

,800 

1 

800 

a 

2 

200 

2 

200 

a 

2 

600 

2 

600 

a 

3 

000 

3 

000 

a 

3 

400 


Paso 4: Anote las ganancias de venta en las clases. Para comenzar, la ganancia de venta 
del primer vehículo en la tabla 2-4 es de $1 387, cifra que se debe anotar en la clase 
de $1 000 a $1 400. La segunda ganancia de la primera columna de la tabla 2-4 es de 
$2 148. Se anota en la clase de $1 800 a $2 200. El resto de las ganancias se cuadran 
de forma similar. Cuando todas las ganancias se hayan registrado, la tabla tendrá la 
siguiente apariencia: 


Ganancia 

Frecuencia 

$ 200 a S 

600 

M III 

600 a 

1 000 

M Wí 1 

1 000 a 

1 400 

MJHÍMMIII 

1 400 a 

1 800 

M1MMMMM III 

1 800 a 

2 200 

IIMIMIM 

2 200 a 

2 600 

m m m jhí jhí jhí ii 

2 600 a 

3 000 

JHÍ JHÍ JHÍ lili 

3 000 a 

3 400 

INI 

Total 




Paso 5: Cuente el número de elementos de cada clase. El número de elementos que hay en 

cada clase recibe el nombre de frecuencia de clase. En la clase de $200 a $600 hay 
8 observaciones, y en la clase de $600 a $1 000 hay 1 1 observaciones. Por lo tanto, 
la frecuencia de clase de la primera clase es de 8, mientras que en la segunda es de 



2.3 Construcción de distribuciones de frecuencias: datos cuantitativos 
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1 1 . Hay un total de 1 80 observaciones o frecuencias en todo el conjunto de datos. Así 
que la suma de todas las frecuencias debe ser igual a 180. 

TABLA 2-i Distribución de frecuencias de ganancias en Applewood Auto Group sobre 
los vehículos que se vendieron el mes pasado 



Ahora que ha organizado los datos en una distribución de frecuencias, resuma el patrón de 
las ganancias por ventas de vehículos del Applewood Auto Group. Observe lo siguiente: 

1 . Las ganancias por vehículo oscilan entre $200 y $3 400. 

2. Las ganancias se concentran entre $1 000 y $3 000. Las ganancias de 157 vehículos, u 
87%, caen dentro de este rango. 

3. La máxima concentración, o frecuencia más alta, se encuentra en la clase que va de 
$1 800 a $2 200. Hay 45 observaciones. La mitad de esta clase se ubica en $2 000. De 
manera que $2 000 representa la ganancia típica de venta de un vehículo. 


Si se le presenta esta información a la señora Ball, se le da un claro panorama de la distribu- 
ción de las ganancias de ventas del mes pasado. 

Admita que la disposición de la información sobre la venta de precios en una distribución 
de frecuencias resulta en una pérdida de información detallada. Es decir, al organizar los datos 
en una distribución de frecuencias, no es posible ubicar con exactitud la ganancia exacta de 
ningún vehículo, como $1 387, $2 148 o $2 201 . Tampoco puede decir que el monto más bajo 
de ganancia de cualquier vehículo vendido es de $294, o que la ganancia máxima fue de 
$3 292. Sin embargo, el límite inferior de la primera clase y el límite superior de la clase más 
grande comunican esencialmente el mismo significado. Lo más probable es que la señora Ball 
llegará a la misma conclusión si conoce que la ganancia más baja es de aproximadamente 
$200 que si sabe que el monto exacto es de $292. Las ventajas de condensar los datos de 
forma más entendible y organizada compensa por mucho esta desventaja. 





Autoevaluación 2-2 


Las comisiones que obtuvieron los once miembros del personal de ventas de Master Chemical 
Company durante el primer trimestre del año pasado son las siguientes: 


$1 650 $1 475 $1 510 $1 670 $1 595 $1 760 $1 540 $1 495 $1 590 $1 625 $1 510 

a) ¿Cómo se denomina a valores de $1 650 y $1 475? 

b) Designe las cantidades que van de $1 400 a $1 500 como la primera clase; a las que oscilan 
entre $1 500 a $1 600, como la segunda clase y así en lo sucesivo, y organice las comisiones 
trimestrales como distribución de frecuencias. 

c) ¿Cómo se denominan los números de la columna derecha de la distribución de frecuencias 
que elaboró? 

d) Describa la distribución de las comisiones trimestrales sobre la base de la distribución de fre- 
cuencias. ¿Cuál es la concentración más grande de comisiones ganadas? ¿Cuál es la menor 
y cuál la mayor? ¿Cuál es la típica cantidad ganada? 


Con frecuencia aparecerán otros dos términos: punto medio de clase e intervalo de 
clase. El punto medio, que se encuentra entre los límites inferiores de dos clases consecuti- 
vas, se calcula sumando los límites inferiores de clases consecutivas y dividiendo el resultado 
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Autoevaluación 2-3 



OA5 Comprender una 
distribución de frecuencias 
relativas. 


Una distribución de frecuen- 
cias relativas convierte la fre- 
cuencia en un porcentaje. 


entre dos. En el caso de la tabla 2-7, el límite de clase inferior de la primera clase es de $200 
y el siguiente límite es de $600. El punto medio de clase es $400, que se calcula mediante la 
operación ($600 + $200)/2. El punto medio de $400 representa mejor, o es típico de, las 
ganancias de venta de los vehículos que pertenecen a dicha clase. 

Para determinar el intervalo de clase, se resta el límite inferior de la clase del límite inferior 
de la siguiente clase. El intervalo de clase de los datos de Applewood Auto Group es de $400, 
que se determina sustrayendo el límite inferior de la primera clase, $200, del límite inferior de 
la siguiente clase; es decir, $600 ($600 - $200 = $400). También se puede determinar el inter- 
valo de clase calculando la diferencia entre puntos medios consecutivos. El punto medio de la 
primera clase es $400 y el punto medio de la segunda clase es $800. La diferencia es $400. 

2.4 Ejemplo con asistencia de software 

Como se indicó en el capítulo 1, existen diversos paquetes de software que permiten llevar a 
cabo cálculos estadísticos. A lo largo del libro aparecen los resultados de Microsoft Excel, 
MegaStat, que es un complemento de Microsoft Excel y de Minitab. Los comandos que se 
necesitan para generar los resultados aparecen en la sección Comandos de software al final 
del capítulo. Mediante esos comandos, usted podrá duplicar la pantalla. 

La siguiente es una distribución de frecuencias, generada por MegaStat, la cual muestra 
los precios de 180 vehículos que el mes pasado vendió Applewood Auto Group. La captura 
de pantalla es algo diferente que la de la distribución de frecuencias de la tabla 2-7, aunque 
las conclusiones generales son las mismas. 

Distribución de frecuencias: Cuantitativa 


Ganancia 

Punto medio 

Ancho 

Frecuencia 

% 

Acumulado 

Más bajo 

Más alto 

Frecuencia 

% 

200 

< 

600 

400 

400 

8 

4.4 

8 

4.4 

600 

< 

1 000 

800 

400 

11 

6.1 

19 

10.6 

1 000 

< 

1 400 

1 200 

400 

23 

12.8 

42 

23.3 

1 400 

< 

1 800 

1 600 

400 

38 

21.1 

80 

44.4 

1 800 

< 

2 200 

2 000 

400 

45 

25.0 

125 

69.4 

2 200 

< 

2 600 

2 400 

400 

32 

17.8 

157 

87.2 

2 600 

< 

3 000 

2 800 

400 

19 

10.6 

176 

97.8 

3 000 

< 

3 400 

3 200 

400 

4 

2.2 

180 

100.0 






180 

100.0 




Barry Bonds, jugador de los Gigantes de San Francisco, estableció una nueva marca de cua- 
dranglares en una sola temporada al conectar 73 durante la temporada 2001 . En el más largo, 
la bola recorrió 488 pies y en el más corto, 320 pies. Usted necesita construir una distribución 
de frecuencias de las longitudes de estos cuadrangulares. 

a) ¿Cuántas clases se requieren? 

b) ¿Qué intervalo de clase sugiere? 

c) ¿Qué clases reales sugiere? 


2.5 Distribución de frecuencias relativas 

Quizá resulte conveniente convertir frecuencias de clase en frecuencias relativas de clase, 
igual que con los datos cualitativos, con el fin de mostrar la fracción del total de observacio- 
nes que hay en cada clase. En el ejemplo de la ganancia por venta de vehículos, podría inte- 
resarle saber qué porcentaje de los precios de vehículos se encuentra en la clase que va de 
$1 000 a $1 400. En otro estudio, tal vez importe saber qué porcentaje de los empleados tomó 
de 5 a 10 días libres el año pasado. Para convertir una distribución de frecuencia en una dis- 
tribución de frecuencia relativa, cada una de las frecuencias de las clases se divide entre el 
número total de observaciones. En el caso de la distribución de ganancias por ventas de ve- 
hículos, la frecuencia relativa de la clase de $1 000 a $1 400 es de 0.128, que se determina 
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dividiendo 23 entre 180. Es decir que las ganancias del 12.8% de los vehículos que vendió 
Applewood Auto Group se encuentra entre $1 000 y $1 400. Las frecuencias relativas del resto 
de las clases aparecen en la tabla 2-8. 

TABLA 2-8 Distribución de frecuencias relativas de las ganancias por los vehículos vendidos 
el mes pasado en Applewood Auto Group 


Ganancia 

Frecuencia 

Frecuencia relativa 

Determinada por 

$ 200 a $ 600 

8 

0.044 

8/180 

600 a 1 000 

11 

0.061 

11/180 

1 000 a 1 400 

23 

0.128 

23/180 

1 400 a 1 800 

38 

0.211 

38/180 

1 800 a 2 200 

45 

0.250 

45/180 

2 200 a 2 600 

32 

0.178 

32/180 

2 600 a 3 000 

19 

0.106 

19/180 

3 000 a 3 400 

4 

0.022 

4/180 

Total 

180 

1.000 




Consulte la tabla 2-8, la cual muestra la distribución de frecuencias relativas de los vehículos que 
se vendieron el mes pasado en Applewood Auto Group. 

a) ¿Cuántos vehículos están en la clase $1 800 a $2 200? 

b) ¿Qué porcentaje de vehículos se vendió con una ganancia de entre $1 800 y $2 200? 

c) ¿Qué porcentaje de vehículos se vendió con una ganancia de $2 200 o más? 


comed 


Ejercicios 

7. Un conjunto de datos consta de 38 observaciones. ¿Cuántas clases recomendaría para la dis- 
tribución de frecuencias? 

8. Un conjunto de datos consta de 45 observaciones entre $0 y $29. ¿Qué tamaño recomendaría 
usted para el intervalo de clase? 

9. Un conjunto de datos consta de 230 observaciones entre $235 y $567. ¿Qué intervalo de clase 
recomendaría? 

10. Un conjunto de datos contiene 53 observaciones. El valor más bajo es 42 y el más alto 129. 
Los datos se van a organizar en una distribución de frecuencias. 

a) ¿Cuántas clases sugeriría? 

b) ¿Qué cantidad sugeriría como límite inferior de la primera clase? 

11. Wachesaw Manufacturing, Inc., produjo la siguiente cantidad de unidades los pasados 16 días. 

Este icono (data file) indica que los datos están disponibles en ei sitio web del libro: www.mhhe.com/lind15e. 

Usted podrá descargar los datos directamente a Excel o Minitab desde el sitio. 


27 

27 

27 

28 

27 

25 

25 

28 

26 

28 

26 

28 

31 

30 

26 

26 


La información se organizará en una distribución de frecuencias. 

a) ¿Cuántas clases recomendaría? 

b) ¿Qué intervalo de clase sugeriría? 

c) ¿Qué límite inferior recomendaría para la primera clase? 

d) Organice la información en una distribución de frecuencias y determine la distribución de 
frecuencias relativas. 

e) Comente la forma de la distribución. 

12. Quick Change Oil Company cuenta con varios talleres en el área metropolitana de Seattle. Las 
cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street los pasa- 
dos veinte días son las siguientes: ^ 


65 

98 

55 

62 

79 

59 

51 

90 

72 

56 

70 

62 

66 

80 

94 

79 

63 

73 

71 

85 


Los datos se organizarán en una distribución de frecuencias. 

a) ¿Cuántas clases recomendaría usted? 

b) ¿Qué intervalo de clase sugeriría? 
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c) ¿Qué límite inferior recomendaría para la primera clase? 

d) Organice el número de cambios de aceite como distribución de frecuencias. 

e) Comente la forma de la distribución de frecuencias. Determine, asimismo, la distribución de 
frecuencias relativas. 

13. El gerente de Bilo Supermarket, en Mt. Pleasant, Rhode Island, reunió la siguiente información 
sobre la cantidad de veces que un cliente visita la tienda durante un mes. Las respuestas de 51 
clientes fueron las siguientes: 


5 

3 

3 

1 

4 

4 

5 

6 

4 

2 

6 

6 

6 

7 

1 

1 

14 

1 

2 

4 

4 

4 

5 

6 

3 

5 

3 

4 

5 

6 

8 

4 

7 

6 

5 

9 

11 

3 

12 

4 

7 

6 

5 

15 

1 

1 

10 

8 

9 

2 

12 











a) Comience a partir de 0 como límite inferior de la primera clase, utilice un intervalo de clase 
de 3 y organice ios datos en una distribución de frecuencias. 

b) Describa la distribución. ¿Dónde tienden a acumularse los datos? 

c) Convierta la distribución en una distribución de frecuencias relativas. 

14. La división de servicios alimentarios de Cedar River Amusement Park, Inc., estudia la cantidad 
que gastan al día en alimento y bebida las familias que visitan el parque de diversiones. Una 
muestra de 40 familias que visitó el parque ayer revela que éstas gastan las siguientes canti- 
dades: 


$77 

$18 

$63 

$84 

$38 

$54 

$50 

$59 

$54 

$56 

$36 

$26 

$50 

$34 

$44 

41 

58 

58 

53 

51 

62 

43 

52 

53 

63 

62 

62 

65 

61 

52 

60 

60 

45 

66 

83 

71 

63 

58 

61 

71 







a) Organice los datos como distribución de frecuencias utilizando siete clases y el 15 como 
límite inferior de la primera clase. ¿Qué intervalo de clase eligió? 

b) ¿Dónde tienden a acumularse los datos? 

c) Describa la distribución. 

d) Determine la distribución de frecuencias relativas. 


OA6 Representar una 
distribución de frecuencias 
de datos por medio de 
histogramas o polígonos 
de frecuencia. 


2.6 Representación gráfica 

de una distribución de frecuencias 

Es frecuente que gerentes de ventas, analistas de bolsa, administradores de hospitales y otros 
ejecutivos necesiten una vista rápida de las tendencias de las ventas, los precios de las accio- 
nes o costos de hospitalización. A menudo, estas tendencias se describen por medio de 
tablas y gráficas. Tres herramientas que serán de utilidad para representar gráficamente una 
distribución de frecuencias son el histograma, el polígono de frecuencias y el polígono de fre- 
cuencias acumuladas. 


Histograma 

Un histograma de una distribución de frecuencias basadas en datos cuantitativos se aseme- 
ja mucho a la gráfica de barras, que muestra la distribución de datos cualitativos. Las clases 
se señalan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de 
clase se representan por medio de las alturas de las barras. Ahora bien, existe una importan- 
te diferencia como consecuencia de la naturaleza de los datos. Por lo general, los datos cuan- 
titativos se miden con escalas continuas, no discretas. Por consiguiente, el eje horizontal 
representa todos los valores posibles y las barras se colocan de forma adyacente para que 
muestren la naturaleza continua de los datos. 


HISTOGRAMA Gráfica en la que las clases se señalan en el eje horizontal y las frecuencias de 
clase en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de 
las barras, que se dibujan de manera adyacente. 


2.6 Representación gráfica de una distribución de frecuencias 


37 


Cjemplo 


Solución 


En seguida aparece la distribución de frecuencias de las ganancias por ventas de vehículos el 
mes pasado en el Applewood Auto Group. 



Ganancia 

Frecuencia 

$ 

200 

a $ 

600 

8 


600 

a 

1 000 

11 

1 

000 

a 

1 400 

23 

1 

400 

a 

1 800 

38 

1 

800 

a 

2 200 

45 

2 

200 

a 

2 600 

32 

2 

600 

a 

3 000 

19 

3 

o 

o 

o 

a 

3 400 

4 

Total 
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Construya un histograma. ¿Qué conclusiones obtiene de la información que se presenta en el 
histograma? 

Las frecuencias de clase se colocan en una escala ubicada en el eje vertical (eje Y), mientras que 
a lo largo del eje horizontal se colocan los límites de clase o los puntos medios de clase. Para 
ilustrar la construcción del histograma, las primeras tres clases aparecen en la gráfica 2-3. 



GRAFICA 2-3 Construcción de un histograma 


Observe que en la gráfica 2-3 la ganancia que produjeron ocho vehículos fue de $200 a 
$600. Por consiguiente, la altura de la columna de dicha clase es 8. Hay 1 1 vehículos en los 
que la ganancia fue de $600 a $1 000. Por consiguiente, es lógico que la altura de dicha colum- 
na sea 1 1 . La altura de la barra representa el número de observaciones en la clase. 

Este procedimiento se aplica en todas las clases. El histograma completo aparece en la 
gráfica 2-4. Advierta que no hay espacio entre las barras. Ésta es una característica del histo- 
grama, debida a que la variable marcada en el eje horizontal es cuantitativa y pertenece a la 
escala de medición de intervalo. En una gráfica de barras, la escala de medición es nominal y 
las barras verticales están separadas. Éstas son diferencias importantes entre el histograma y 
la gráfica de barras. 

A partir del histograma de la gráfica 2-4, es posible concluir lo siguiente: 

1 . La ganancia que se obtuvo por la venta de un vehículo está en un rango de $200 a $3 400. 

2. Las ganancias se concentran entre $1 000 y $3 000. La ganancia sobre 157 vehículos, u 
87%, cayeron dentro de este rango. 

3. La mayor concentración, o frecuencia más alta, se encuentra en la clase de $1 800 a 
$2 200. La mitad de esta clase es $2 000. Por lo tanto, la ganancia típica en la venta de un 
vehículo es de $2 000. 
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Estadística en acción 

A Florence Nightingale 
se le conoce como la fun- 
dadora de la profesión de 
enfermería. Sin embargo, 
también salvó muchas 
vidas con la ayuda del 
análisis estadístico. 
Cuando se encontraba en 
condiciones poco higiéni- 
cas o en un hospital sin 
suficientes provisiones, 
mejoraba las condiciones 
y, en seguida, empleaba 
los datos estadísticos para 
documentar las mejoras. 
De esta manera conven- 
ció a otros de la necesi- 
dad de una reforma 
médica, en particular en 
el área de salubridad. 
Diseñó gráficas originales 
para demostrar que, 
durante la guerra de 
Crimea, murieron más 
soldados a causa de las 
condiciones insalubres 
en combate. 



CO O) 
O C/D 
"O CC 


48 

40 

32 

24 

16 

8 


45 



GRÁFICA 2-4 Histog rama de ganancias sobre 180 vehículos que vendió Applewood Auto Group 


Por consiguiente, el histograma proporciona una representación visual de una distribución 
de frecuencias de fácil interpretación. También cabe señalar que de haber empleado una dis- 
tribución de frecuencias relativas en lugar de las frecuencias reales, las conclusiones y la forma 
del histograma hubieran sido las mismas. Es decir, si hubiera empleado las frecuencias rela- 
tivas de la tabla 2-8, el histograma tendría la misma forma que la gráfica 2-4. La única diferen- 
cia consiste en que el eje vertical representaría el porcentaje en lugar de la cantidad de ve- 
hículos. 

Utilizamos el sistema Microsoft Excel para producir el histograma de los datos de venta de 
Applewood Auto Group. Advierta que los puntos medios de clase se emplean como etiquetas 
de las clases. Los comandos del software para crear este resultado se incluyen en la sección 
Comandos de software, que aparece al final del capítulo. 
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Polígono de frecuencias 

Un polígono de frecuencias también muestra la forma que tiene una distribución y es similar 
a un histograma. Consiste en segmentos de recta que conectan los puntos que forman las 
intersecciones de los puntos medios de clase y las frecuencias de clase. En la gráfica 2-5 (en 
la página 39) se ilustra la construcción de un polígono de frecuencias. Se emplearon las 
ganancias sobre los vehículos vendidos el mes pasado en Applewood Auto Group. El punto 
medio de cada clase se indica en una escala en el eje X y las frecuencias de clase en el eje Y. 
Recuerde que el punto medio de clase es el valor localizado en el centro de una clase y repre- 
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senta los valores típicos de ella. La frecuencia de clase es el número de observaciones que 
hay en una clase particular. Las ganancias que se obtuvieron por la venta de los vehículos en 
Applewood Auto Group el mes pasado se repiten a continuación: 


Ganancia 

Punto medio 

Frecuencia 

$ 200 a $ 600 

$ 400 

8 

600 a 1 000 

800 

11 

1 000 a 1 400 

1 200 

23 

1 400 a 1 800 

1 600 

38 

1 800 a 2 200 

2 000 

45 

2 200 a 2 600 

2 400 

32 

2 600 a 3 000 

2 800 

19 

3 000 a 3 400 

3 200 

4 

Total 


180 


Como se señaló antes, la clase que va de $200 a $600 está representada por el punto 
medio $400. Para construir un polígono de frecuencias, hay que desplazarse horlzontalmente 
sobre la gráfica al punto medio, $400, y en seguida de manera vertical al 8, la frecuencia de 
clase, donde se coloca un punto. Los valores de X y de Y de este punto reciben el nombre 
de coordenadas. Las coordenadas del siguiente punto son X = 800 y Y = 1 1 . El proceso conti- 
núa con todas las clases. Posteriormente, los puntos se conectan de manera ordenada. Es 
decir, que el punto que representa la clase más baja se une al que representa la segunda clase 
y así en lo sucesivo. Observe que en la gráfica 2-5, para completar el polígono de frecuencias, 
se añaden los puntos medios de $0 y $3 600 para anclar el polígono en la frecuencia cero. 
Estos dos valores, $0 y $3 600, se obtuvieron restando el Intervalo de clase $400 al punto 
medio más bajo ($400) y sumando $400 al punto medio más alto ($3 200) en la distribución de 
frecuencias. 
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Ganancias (en dólares) 


GRÁFICA 2-5 


Polígono de frecuencias de las ganancias sobre 180 vehículos que vendió 
Applewood Auto Group 


Tanto el histograma como el polígono de frecuencias permiten tener una vista rápida de 
las principales características de los datos (máximos, mínimos, puntos de concentración, etc.). 
Aunque las dos representaciones tienen un propósito similar, el histograma posee la ventaja 
de que describe cada clase como un rectángulo, en el que la barra de altura de éste represen- 
ta el número de elementos que hay en cada clase. El polígono de frecuencias, en cambio, tiene 
una ventaja con respecto al histograma. También permite comparar directamente dos o más 
distribuciones de frecuencias. Suponga que la señora Ball desea comparar las ganancias por 
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vehículo vendido en Applewood Auto Group con las que obtuvo un grupo similar, Fowler 
Motors, ubicado en Grayling, Michigan. Para hacerlo, debe construir dos polígonos de fre- 
cuencias, uno sobre el otro, como lo muestra la gráfica 2-6. A partir de la gráfica, dos cosas 
resultan evidentes: 

• Que la ganancia típica que obtiene Fowler es más alta: alrededor de $2 000 Applewood 
Auto Group y $2 400 Fowler. 

• Existe menos dispersión en las ganancias en Fowler Motors que en Applewood. El límite 
inferior de la primera clase de Applewood es $0 y el superior, $3 600. En el caso de 
Fowler Motors, el límite inferior es $800 y el superior es el mismo: $3 600. 

El número total de autos vendidos en las dos concesionarias es aproximadamente el 
mismo, así que es posible llevar a cabo una comparación directa. Si la diferencia entre 
el número total de autos vendidos es mayor, convertir las frecuencias en frecuencias relativas 
y representar en seguida las dos distribuciones permitiría obtener una comparación más clara. 



GRAFICA 2-6 Distribución de ganancias de vehículos en Applewood Auto Group 


y en Fowler Motors 



Las importaciones anuales de un grupo de proveedores del sector electrónico aparecen en la 
siguiente distribución de frecuencias. 


Importaciones 
(millones de dólares) 

Número de 
proveedores 

Importaciones 
(millones de dólares) 

Número de 
proveedores 

2a 5 

6 

11 a 14 

10 

5a 8 

13 

14 a 17 

1 

8 a 11 

20 




a) Represente las importaciones por medio de un histograma. 

b) Muestre las importaciones por medio de un polígono de frecuencias relativas. 

c) Resuma las facetas importantes de la distribución (como clases, incluyendo las frecuencias 
más alta y más baja). 
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comed 


Ejercicios 

15. Molly’s Candie Shop tiene diversas tiendas de venta de menudeo en las áreas costeras de Carolina 
del Norte y Carolina del Sur. Muchos de los clientes de Molly's han solicitado que les envíe sus 
compras. La siguiente gráfica muestra el número de paquetes enviados por día durante los pasa- 
dos 100 días. 


Frecuencia 

— L ro co 

o o o o 

- 5 

13 

28 

23 

18 

10 

3 

1 


10 15 20 25 30 35 

Número de paquetes 


a) ¿Qué nombre recibe la gráfica? 

b) ¿Cuál es el número total de frecuencias? 

c) ¿Cuál es el intervalo de clase? 

d) ¿Cuál es la frecuencia de clase en las clases 10 a 15? 

e) ¿Cuál es la frecuencia relativa en las clases 1 0 a 1 5? 

f ) ¿Cuál es el punto medio de las clases 10 a 15? 

g) ¿En cuántos días se enviaron 25 o más paquetes? 

16. La siguiente gráfica muestra el número de pacientes que admite diariamente el Memorial Hospital 
por la sala de urgencias. 
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Número de pacientes 


a) ¿Cuál es el punto medio de la clase que va de 2 a 4? 

b) ¿Cuántos días se admitió de 2 a 4 pacientes? 

c) ¿Aproximadamente cuántos días fueron estudiados? 

d) ¿Cuál es el intervalo de clase? 

e) ¿Qué nombre recibe esta gráfica? 

17. La siguiente distribución de frecuencias muestra el número de millas de viajero frecuente, expre- 
sado en miles de millas, de empleados de Brumley Statistical Consulting, Inc., durante el trimes- 
tre más reciente. 


Millas de viajero 
frecuente (millas) 

Número de 
empleados 

0 a 3 

5 

3 a 6 

12 

6 a 9 

23 

9 a 12 

8 

12 a 15 

2 

Total 

50 


a) ¿Cuántos empleados se estudiaron? 

b) ¿Cuál es el punto medio de la primera clase? 

c) Construya un histograma. 
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d) Dibuje un polígono de frecuencias. ¿Cuáles son las coordenadas de la marca correspondien- 
tes a la primera clase? 

e) Construya un polígono de frecuencias. 

f ) Interprete las millas de viajero frecuente acumuladas utilizando las dos gráficas. 

18. Ecommerce.com, un minorista grande de internet, estudia el tiempo de entrega (el tiempo que 
transcurre desde que se hace un pedido hasta que se entrega) en una muestra de pedidos recien- 
tes. Los tiempos de espera se expresan en días. 


Tiempo de espera (días) 

Frecuencia 

Oa 5 

6 

5 a 10 

7 

10 a 15 

12 

15 a 20 

8 

20 a 25 

7 

Total 

40 


a) ¿Cuántos pedidos se estudiaron? 

í>) ¿Cuál es el punto medio de la primera clase? 

c) ¿Cuáles son las coordenadas de ia primera clase en un polígono de frecuencias? 

d) Trace un histograma. 

e) Dibuje un polígono de frecuencias. 

f ) Interprete los tiempos de espera mediante las dos gráficas. 

Distribuciones de frecuencia acumulativas 

0A7 Construir e interpretar 
una distribución de 
frecuencia acumulativa. 


Considere de nuevo la distribución de las ganancias sobre vehículos que vendió Applewood 
Auto Group. Suponga que el interés radica en la cantidad de vehículos que se vendieron con 
una ganancia de menos de $1 400, o la ganancia que se obtuvo en el valor debajo del cual se 
vendió 40% de los vehículos. Estas cantidades se aproximan mediante una distribución de 
frecuencias acumulativas con representación gráfica de un polígono de frecuencias acu- 
mulativas. 



La distribución de frecuencias de las ganancias que obtuvo Applewood Auto Group se toma de 
la tabla 2-7. 



Construya un polígono de frecuencias acumulativas. ¿En menos de qué cantidad se sitúa la 
ganancia que se obtuvo por 75% de los vehículos? ¿En menos de qué cantidad se sitúa 
la ganancia que se obtuvo por sesenta vehículos? 

Como su nombre lo indica, una distribución de frecuencias acumulativas y un polígono de fre- 
cuencias acumulativas implican frecuencias acumulativas. Para construir una distribución de 
frecuencias acumulativas, consulte la tabla anterior y observe que 8 vehículos se vendieron con 
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una ganancia menor a $600. Esos 8 vehículos, más 11 de la clase inmediatamente superior, que 
dan un total de 19, rindieron una ganancia menor a $1 000. La frecuencia acumulativa de la 
siguiente clase superior consecutiva es de 42, calculada mediante la operación 8 + 11 +23. 
Este proceso se repite en el caso de todas las clases. Todos los vehículos produjeron una 
ganancia menor a $3 400 (vea la tabla 2-9). 


TABLA 2-í Distribución de frecuencias acumulativas de las ganancias obtenidas por vehículos 
vendidos el mes pasado en Applewood Auto Group 


Ganancia 

Frecuencia Frecuencia acumulativa 




Calculada asi 


$ 200 a $ 600 

8 

8 

8 











600 a 

1 000 

11 

19 

8 

+ 

11 









1 000 a 

1 400 

23 

42 

8 

+ 

11 

+ 

23 







1 400 a 

1 800 

38 

80 

8 

+ 

11 

+ 

23 + 

30 






1 800 a 

2 200 

45 

125 

8 

+ 

11 

+ 

23 + 

30 

+ 

45 




2 200 a 

2 600 

32 

157 

8 

+ 

11 

+ 

23 + 

30 

+ 

45 

+ 

32 


2 600 a 

3 000 

19 

176 

8 

+ 

11 

+ 

23 + 

30 

+ 

45 

+ 

32 + 

19 

3 000 a 

3 400 

4 

180 

8 

+ 

11 

+ 

23 + 

30 

+ 

45 

+ 

32 + 

19 + 4 

Total 


180 















Para trazar una distribución de frecuencias acumulativas, se ubica el límite superior de 
cada clase en una escala a lo largo del eje X, y las correspondientes frecuencias acumulativas, 
a lo largo del eje Y. Para incluir información adicional, gradúe el eje vertical a la izquierda en uni- 
dades y el eje vertical a la derecha en porcentajes. En el ejemplo de Applewood Auto Group, el 
eje vertical que se localiza a la izquierda se gradúa desde 0 hasta 180 y a la derecha de 0% a 
100%. El valor de 50% corresponde a 90 vehículos. 

Para comenzar, la primera marca se coloca en X = 200 y Y = 0. Ninguno de los vehículos 
se vendió con una ganancia menor a $200. La ganancia de 8 vehículos fue menor de $600, así 
que la siguiente marca es X = 600 y Y = 8. A continuación, la próxima marca es X = 1 000 y 
T = 19. Se registraron 19 vehículos vendidos con una ganancia menor a $1 000. Se dibuja el 
resto de los puntos y en seguida se conectan para formar la gráfica que sigue. 



Ganancia (en dólares) 


GRAFICA 2-7 Distribución de frecuencias acumulativas por ganancia en vehículos 
que el mes pasado vendió Applewood Auto Group 
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Para determinar el monto de la ganancia que se obtuvo en 75% de los autos vendidos, 
trace una línea horizontal en la marca de 75%, ubicada en el eje vertical de la derecha, hasta 
el polígono; en seguida baje al eje X y lea el monto de ganancias. El valor sobre el eje X es de 
aproximadamente $2 300, así que se estima que 75% de los vehículos rindieron una ganancia 
menor a $2 230 para Applewood Group. 

Para determinar la ganancia que obtuvo en 60 vehículos, localice el valor de 60 en el eje 
vertical de la derecha. Luego, trace una línea horizontal a partir del valor de 60 al polígono y 
después baje al eje X y lea el monto. Éste es de aproximadamente $1 590, así que se estima 
que 60 vehículos se vendieron con una ganancia menor a $1 590. También es posible hacer 
aproximaciones del porcentaje de vehículos vendidos en menos de cierta cantidad. Por ejem- 
plo, suponga que desea calcular el porcentaje de vehículos que se vendieron con una ganan- 
cia menor a $1 600. Para comenzar, localice el valor de $1 600 en el eje X, desplácese por la 
vertical hasta el polígono y en seguida por la horizontal hasta el eje vertical de la derecha. El 
valor es de aproximadamente 56%, así que se concluye que 56% de los vehículos se vendie- 
ron con una ganancia menor a $1 600. 



En la siguiente tabla se organizó una muestra de salarios por hora de 15 empleados de Home 
Depot, ubicada en Brunswick, Georgia: 




Salarios por hora 

Número de empleados 

$ 8 3 

$10 

3 

10 a 

12 

7 

12 a 

14 

4 

14 a 

16 

1 


a) ¿Qué nombre recibe la tabla? 

b) Elabore una distribución de frecuencias acumulativas y represente la distribución en un polígo- 
no de frecuencias acumulativas. 

c) De acuerdo con el polígono de frecuencias acumulativas, ¿cuántos empleados ganan $1 1 .00 o 
menos la hora? ¿La mitad de los empleados ganan más? ¿Cuatro empleados ganan cuánto 
menos o más? 


comed: 


Ejercicios 

19. La siguiente gráfica muestra los salarios por hora que percibe una muestra de soldadores en la 
zona de Atlanta, Georgia. 


cd 

’o 



Salario por hora 


a) ¿A cuántos soldadores se estudió? 
í>) ¿Cuál es el intervalo de clase? 
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c) ¿Aproximadamente cuántos soldadores ganan menos de $10.00 la hora? 

d) ¿Alrededor de 75% de los soldadores ganan menos de cierta cantidad. ¿Qué cantidad es 
ésta? 

e) Diez de los soldadores estudiados ganan menos de cierta cantidad. ¿Qué cantidad es ésta? 

f ) ¿Qué porcentaje de soldadores gana menos de $20.00 la hora? 

20. La siguiente gráfica muestra los precios de venta (miles de dólares) de casas que se vendieron en 
la zona de Billings, Montana. 



a) ¿Cuántas casas se estudiaron? 

b) ¿Cuál es el intervalo de clase? 

c) ¿En menos de qué cantidad se vendieron 100 casas? 

d) ¿En menos de qué cantidad se vendió alrededor de 75% de las casas? 

e) Aproxime el número de casas que se vendieron en la clase que va de $150 000 a $200 000. 

f ) ¿Qué cantidad de casas se vendieron en menos de $225 000? 

21. Se repite la distribución de frecuencias del ejercicio 17, que representa el número de millas de via- 
jero frecuente acumuladas por empleados de Brumley Statistical Consulting Company. 


Millas de viajero 
frecuente (miles) 

Frecuencia 

0 a 3 

5 

3 a 6 

12 

6 a 9 

23 

9 a 12 

8 

12 a 15 

2 

Total 

50 


a) ¿Cuántos empleados acumularon menos de 3 000 millas? 

b) Convierta la distribución en una distribución de frecuencias acumulativas. 

c) Represente la distribución de frecuencias acumulativas en forma de polígono de frecuencias 
acumulativas. 

d) De acuerdo con el polígono de frecuencias, ¿cuántas millas acumuló 75% de los empleados? 

22. La distribución de frecuencias de los tiempos de espera en Ecommerce.com, en el ejercicio 18, se 

repite a continuación. 


Tiempo de espera (días) 

Frecuencia 

0 a 5 

6 

5 a 10 

7 

10 a 15 

12 

15 a 20 

8 

20 a 25 

7 

Total 

40 


a) ¿Cuántos pedidos se despacharon en menos de 10 días? ¿En menos de 15 días? 

b) Convierta la distribución de frecuencias en una distribución de frecuencias acumulativas. 

c) Diseñe un polígono de frecuencias acumulativas. 

d) ¿En menos de cuántos días se despachó alrededor de 60% de los pedidos? 
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Resumen del capítulo 

I. Una tabla de frecuencias es una agrupación de datos cualitativos en clases mutuamente excluyen- 
tes, que muestra el número de observaciones que hay en cada clase. 

II. Una tabla de frecuencias relativas muestra la fracción del número de frecuencias en cada clase. 

III. Una gráfica de barras es una representación de una tabla de frecuencias. 

IV. Una gráfica de pastel muestra la parte que cada clase representa del número total de frecuencias. 

V. Una distribución de frecuencias es una agrupación de datos en clases mutuamente excluyentes 
que muestra el número de observaciones que hay en cada clase. 

A. Los pasos para construir una distribución de frecuencias son los siguientes: 

1. Decidir el número de clases. 

2. Determinar el intervalo de clase. 

3. Establecer los límites de cada clase. 

4. Anotar los datos en bruto de las clases. 

5. Enumerar los elementos en cada clase. 

B. La frecuencia de clase es el número de observaciones que hay en cada clase. 

C. El Intervalo de clase es la diferencia entre los límites de dos clases consecutivas. 

D. El punto medio de clase representa la mitad entre los límites de clases consecutivas. 

VI. Una distribución de frecuencias relativas muestra el porcentaje de observaciones de cada clase. 
Vil. Existen tres métodos para hacer una representación gráfica de una distribución de frecuencias. 

A. Un histograma representa el número de frecuencias en cada clase en forma de rectángulo. 

B. Un polígono de frecuencias consiste en segmentos de recta que unen los puntos formados por 
la intersección del punto medio de clase con la frecuencia de clase. 

C. Una distribución de frecuencias acumulativas muestra el número o porcentaje de observaciones 
por debajo de valores dados. 


comed; 


Ejercicios del copítulo 

23. Describa las similitudes y diferencias de las variables cualitativa y cuantitativa. Asegúrese de con- 
siderar lo siguiente: 

a) El nivel de medición que se requiere para cada tipo de variable. 

b) Si ambos tipos sirven para describir muestras y poblaciones. 

24. Describa las similitudes y diferencias entre una tabla de frecuencias y una distribución de frecuen- 
cias. Asegúrese de incluir cuál requiere datos cualitativos y cuál datos cuantitativos. 

25. Alexandra Damonte construirá un nuevo centro vacacional en Myrtle Beach, Carolina del Sur. Debe 
decidir la manera de diseñar la obra sobre la base del tipo de actividades que ofrecerá el centro 
vacacional a sus clientes. Una encuesta reciente de 300 posibles clientes mostró los siguientes 
resultados relacionados con las preferencias de los consumidores en lo que se refiere a activida- 
des recreativas: 


Les gustan las actividades planeadas 

63 

No les gustan las actividades planeadas 

135 

No están seguros 

78 

No responden 

24 


a) ¿Qué nombre recibe la tabla? 

b) Diseñe una gráfica de barras para representar los resultados de la encuesta. 

c) Trace una gráfica de pastel que muestre los resultados de la encuesta. 

d) Si usted se está preparando para presentar los resultados a la señora Damonte como parte de 
un informe, ¿qué gráfica preferiría mostrar? ¿Por qué? 

26. Speedy Swift es un servicio de reparto de mercancía que atiende el área metropolitana más gran- 
de de Atlanta, Georgia. Para conservar la lealtad del consumidor, uno de sus objetivos de desem- 
peño es la entrega a tiempo. Con el fin de supervisar su desempeño, cada entrega se mide de 
acuerdo con la siguiente escala: anticipada (mercancía entregada antes del tiempo prescrito); a 
tiempo (mercancía entregada cinco minutos dentro del tiempo prescrito); tarde (mercancía entre- 
gada más de cinco minutos después del tiempo prescrito); extraviada (mercancía no entregada). 
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El objetivo de Speedy Swift consiste en entregar 99% de la mercancía en forma anticipada o a 
tiempo. Otro objetivo es jamás perder un paquete. 

Speedy recogió ios siguientes datos del desempeño dei mes pasado: 


A tiempo 

A tiempo 
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Tarde 

A tiempo 
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A tiempo 

A tiempo 

Tarde 

A tiempo 

Anticipada 

A tiempo 

A tiempo 

Anticipada 
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A tiempo 
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Anticipada 
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Anticipada 
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A tiempo 

A tiempo 

Anticipada 

A tiempo 

A tiempo 

A tiempo 

Anticipada 

A tiempo 

A tiempo 

Tarde 

Anticipada 

Anticipada 
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A tiempo 

Anticipada 
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Tarde 
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Extraviada 
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Tarde 
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Extraviada 
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Anticipada 
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Anticipada 

A tiempo 

Anticipada 

A tiempo 

Tarde 

A tiempo 
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Anticipada 

A tiempo 
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Tarde 

A tiempo 

Anticipada 

A tiempo 

A tiempo 

A tiempo 

A tiempo 

A tiempo 

A tiempo 

A tiempo 

Anticipada 

Anticipada 

A tiempo 

A tiempo 

A tiempo 


a) ¿Qué escala se empleó para medir el desempeño del reparto? ¿Qué clase de variable es el des- 
empeño del reparto? 

b) Construya una tabla de frecuencias que muestre el desempeño de reparto en el mes pasado. 

c) Construya una tabla de frecuencias relativas del desempeño de reparto en el mes pasado. 

d) Dibuje una gráfica de barras de la tabla de frecuencias del desempeño de reparto en el mes 
pasado. 

e) Construya una gráfica de pastel del desempeño del reparto a tiempo durante el mes pasado. 

f) Analice los resúmenes de datos y redacte una evaluación del desempeño del reparto durante 
el mes pasado en relación con los objetivos de desempeño de Speedy. Elabore una recomen- 
dación general para realizar un análisis posterior. 

27 . Un conjunto de datos incluye 83 observaciones. ¿Cuántas clases recomendaría para elaborar una 
distribución de frecuencias? 

28 . Un conjunto de datos consta de 145 observaciones que van de 56 a 490. ¿Qué tamaño de inter- 
valo de clase recomendaría? 

29 . A continuación se muestra el número de minutos que emplea un grupo de ejecutivos para viajar 
en automóvil de su casa al trabajo. m 
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a) ¿Cuántas clases recomendaría? 

b) ¿Cuántos intervalos de clase sugeriría? 

c) ¿Qué intervalo de clase sugeriría como límite inferior de la primera clase? 

d) Organice los datos en una distribución de frecuencias. 

e) Comente la forma de la distribución de frecuencias. 

30 . Los siguientes datos proporcionan las cantidades semanales que gasta en abarrotes una muestra 
de hogares. r m 
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232 
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192 
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309 
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50 

41 
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116 

100 

151 

240 

474 

297 
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188 

320 

429 

294 

570 

342 

279 

235 

434 

123 

325 


a) ¿Cuántas clases recomendaría? 
ib) ¿Qué intervalo de clase sugeriría? 

c) ¿Cuál recomendaría como límite inferior de la primera clase? 

d) Organice los datos en una distribución de frecuencias. 
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31. Un científico social investiga el uso de ¡Pods entre los estudiantes universitarios. Una muestra de 
45 estudiantes reveló que escucharon ayer el siguiente número de canciones. 
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Organice esa información en una distribución de frecuencias. 

a) ¿Cuántas clases sugiere? 

ib) ¿Cuál es el intervalo de clase más apropiado? 

c) ¿Cuál es el límite inferior de la clase inicial? 

cf) Elabore la distribución de frecuencias. 

e) Describa el perfil de la distribución. 

32. Por muchos años, David Wise ha manejado su propio portafolio de inversiones. Abajo se enlista el 
periodo de tenencia (registrado al último año completo) entre la compra y la venta de su colección 
de acciones. Sífi 
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a) ¿Cuántas clases propone? 
ib) ¿Oué intervalo de clase sugiere? 

c) ¿Oué cantidad utilizaría para el límite inferior de la clase inicial? 

cf) Con base en sus respuestas a los incisos a), b) y c), construya una distribución de frecuencias, 
e) Identifique la apariencia de la distribución de frecuencias. 

33. Está usted explorando la música en su librería de ¡Tunes. El número total de reproducciones duran- 
te el último año de las canciones que están en su lista de “favoritas” se muestra a continuación. 
Elabore una distribución de frecuencias de las reproducciones y describa su forma. A menudo se 
dice que una pequeña fracción de las canciones de una persona representa la mayoría de sus 
reproducciones totales. ¿Éste parece ser el caso aquí? m 
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34. A partir de julio de 2005, el Journal of Finance puso su contenido a disposición de los lectores en 
internet. La tabla siguiente muestra el número de veces que se descargó una versión mensual, y 
el número de artículos que fueron vistos cada mes. Suponga que desea hacer una distribución de 
frecuencias del número de descargas. J 


312 

2 753 

2 595 

6 057 

7 624 

6 624 

6 362 

6 575 

7 760 

7 085 

7 272 

5 967 

5 256 

6 160 

6 238 

6 709 

7 193 

5 631 

6 490 

6 682 

7 829 

7 091 

6 871 

6 230 

7 253 

5 507 

5 676 

6 974 

6 915 

4 999 

5 689 

6 143 

7 086 


a) ¿Cuántas clases propone? 

b) Sugiera un intervalo de clase. 

c) ¿Qué cantidad usaría para el límite inferior de la clase inicial? 

cf) En base a sus respuestas a los incisos a), b) y c), cree una distribución de frecuencias, 
e) Identifique la apariencia de la distribución de frecuencias. 
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35. El siguiente histograma muestra los resultados en el primer examen de una clase de estadística. 



a) ¿Cuántos estudiantes presentaron el examen? 

£>) ¿Cuál es el intervalo de clase? 

c) ¿Cuál es el punto medio de la primera clase? 

d) ¿Cuántos estudiantes obtuvieron un resultado inferior a 70? 

36. La siguiente gráfica resume el precio de venta de casas vendidas el mes pasado en la zona de 
Sarasota, Florida. 
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a) ¿Qué nombre recibe la gráfica? 

£>) ¿Cuántas casas se vendieron el mes pasado? 

c) ¿Cuál es el intervalo de clase? 

d) ¿En menos de qué cantidad se vendió 75% de las casas? 

e) ¿En menos de qué precio se vendieron 175 casas? 

37. Una cadena de tiendas deportivas que satisface las necesidades de los esquiadores principiantes, 
con matriz en Aspen, Colorado, planea llevar a cabo un estudio sobre la cantidad de dinero que 
un esquiador novato gasta en su compra inicial de equipo y provisiones. Con base en estas can- 
tidades, desea analizar la posibilidad de ofrecer equipo, como un par de botas y un par de esquíes, 
para inducir a los clientes a comprar más. Una muestra de los comprobantes de la caja registra- 
dora reveló las siguientes compras iniciales: 
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a) Sugiera un intervalo de clase. Utilice seis clases y fije en $70 el límite inferior de la primera clase. 

b) ¿Cuál sería el mejor intervalo de clase? 

c) Organice los datos en una distribución de frecuencias utilizando un límite inferior de $80. 
cf) Interprete sus hallazgos. 
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38. Las siguientes son las cantidades de accionistas de un grupo selecto de compañías grandes (en 
miles): 


Compañía 

Cantidad de 
accionistas 
(miles) 

Compañía 

Cantidad de 
accionistas 
(miles) 

Southwest Airlines 

144 

Standard Oil (Indiana) 

173 

General Public Utilities 

177 

Home Depot 

195 

Occidental Petroleum 

266 

Detroit Edison 

220 

Middle South Utilities 

133 

Eastman Kodak 

251 

Chrysler 

209 

Dow Chemical 

137 

Standard Oil of California 

264 

Pennsylvania Power 

150 

Bethlehem Steel 

160 

American Electric Power 

262 

Long Island Lightlng 

143 

Ohio Edison 

158 

RCA 

246 

Transamerica Corporation 

162 

Greyhound Corporation 

151 

Columbia Gas System 

165 

Pacific Gas & Electric 

239 

International Telephone & 


Nlagara Mohawk Power 

204 

Telegraph 

223 

E. 1. du Pont de Nemours 

204 

Union Electric 

158 

Westinghouse Electric 

195 

Virginia Electric and Power 

162 

Union Carbide 

176 

Public Service Electric & Gas 

225 

BankAmerica 

175 

Consumers Power 

161 

Northeast Utilities 

200 




Las cantidades de accionistas se deben organizar en una distribución de frecuencias y se diseña- 
rán varias gráficas para representar la distribución. 

a) Utilizando siete clases y un límite inferior de 130, construya una distribución de frecuencias, 
ib) Represente la distribución como polígono de frecuencias. 

c) Dibuje la distribución en un polígono de frecuencias acumulativas. 

d) De acuerdo con el polígono, ¿cuántos accionistas tienen tres de las cuatro (75%), o menos, 
compañías? 

e) Redacte un breve análisis relacionado con el número de accionistas con base en la distribución 
de frecuencias y las gráficas. 

39. Una encuesta reciente mostró que el estadounidense típico que posee automóvil gasta $2 950 
anuales en gastos para operarlo. En seguida aparece un desglose detallado de los gastos en ar- 
tículos. Diseñe una gráfica adecuada que represente los datos y resuma sus hallazgos en un breve 
informe. 


Artículo que genera el gasto 

Gasto 

Gasolina 

$ 603 

Intereses de crédito del automóvil 

279 

Reparaciones 

930 

Seguro y licencia 

646 

Depreciación 

492 

Total 

$2 950 


40. Midland National Bank seleccionó una muestra de 40 cuentas de cheques de estudiantes. A con- 
tinuación aparecen sus saldos de fin de mes. 
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350 

440 

37 
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27 
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302 
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968 
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327 

608 

358 
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303 

203 
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a) Organice los datos en una distribución de frecuencias utilizando $100 como intervalo de clase 
y $0 como punto de partida, 
ib) Elabore un polígono de frecuencias acumulativas. 

c) El banco considera a cualquier estudiante con un saldo final de $400 o más como cliente pre- 
ferido. Calcule el porcentaje de clientes preferidos. 

d) El banco hace un cargo por servicio de 10% a los saldos finales más bajos. ¿Qué cantidad 
recomendaría como punto límite entre los que pagan un cargo por servicio y los que no lo 
hacen? 

41 . Los residentes de Carolina del Sur ganaron un total de 69.5 mil millones de dólares por concepto 
de ingreso bruto ajustado. Setenta y tres por ciento del total correspondía a sueldos y salarios; 
1 1 % a dividendos, intereses y utilidades sobre capital; 8% a fondos para el retiro y pensiones suje- 
tas a impuestos; 3% a pensiones de ingresos por negocio; 2% a seguridad social, y 3% a otras fuen- 
tes. Genere una gráfica de pastel que describa el desglose del ingreso bruto ajustado. Redacte un 
párrafo que resuma la información. 

42 . Un estudio reciente de tecnologías domésticas informó el número de horas de uso semanal de las 
computadoras personales en una muestra de 60 personas. Se excluyeron del estudio personas 
que laboraban fuera del hogar y empleaban la computadora como parte de su trabajo. m 
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a) Organice los datos en una distribución de frecuencias. ¿Cuántas clases sugeriría? ¿Qué valor 
sugeriría para un intervalo de clase? 

£>) Elabore un histograma. Interprete el resultado que obtuvo. 

43 . Merrill Lynch concluyó un estudio relacionado con el tamaño de las carteras de inversión en línea 
(acciones, bonos, fondos mutuos y certificados de depósito) en una muestra de clientes del grupo 
de 40 a 50 años de edad. A continuación aparece el valor de las inversiones en miles de dólares 
de los 70 participantes. ^ 
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$645.2 

301.9 
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26.6 

187.2 

315.5 
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228.6 

308.7 
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156.7 
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23.5 
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154.9 
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100.6 
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171.9 
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a) Organice los datos en una distribución de frecuencias. ¿Cuántas clases sugeriría? ¿Qué valor 
propondría para un intervalo de clase? 

b) Diseñe un histograma. Interprete el resultado que obtuvo. 

44 . Un total de 5.9% del público que veía la televisión durante las horas de mayor audiencia se con- 
centraba en programas de la ABC; 7.6%, de la CBS; 5.5%, de Fox; 6.0%, de la NBC; 2.0%, de 
Warner Brothers, y 2.2%, de UPN. Un total de 70.8% de la audiencia veía programas de otras 
cadenas televisivas de cable, como CNN y ESPN. El siguiente sitio web contiene información 
reciente sobre la audiencia televisiva: http://tv.zap2it.com/news/ratings. Diseñe una gráfica de pas- 
tel o de barras para describir esta información. Redacte un párrafo que resuma sus hallazgos. 
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45. Remítase a la siguiente gráfica, que apareció recientemente en la sección Snapshot de USA Today. 


Un tercio de las parejas 
se casan al aire libre. 


Las novias 
eligen el sitio 
de su boda 



Lugaral \ 

aire libre 

Templo 

Club/salón/restaurante i 


No está segura tx 
Algún otro lugar 4 


Por Michelle Healy y Verónica Salazar, USA Today 
Fuente: Revista BRIDE'S 

Reimpreso con autorización (28 de enero de 2010) USA TODAY 


a) ¿Cuál es el nombre de este tipo de gráfica? 

b) Si estudió 500 bodas, ¿cuántas esperaría que tuvieran lugar en un templo? 

c) ¿Sería razonable concluir que cerca de 80% de las bodas se efectúan ya sea en un templo o 
al aire libre? Proporcione evidencia. 

46. La siguiente gráfica representa los ingresos anuales, por tipo de impuesto, del estado de Georgia. 
La gráfica se desarrolló usando Kids Zone, un proyecto de NCES (Centro Nacional de Estadísticas 
de la Educación). Su sitio web es: nces.ed.gov/nceskids/creategraph/. 



a) ¿Qué porcentaje de los ingresos estatales representa el impuesto a la venta y ei impuesto al 
ingreso individual? 

b) ¿Qué categoría genera más ingresos: los impuestos corporativos o las licencias? 

c) El ingreso anual total del estado de Georgia es de 6.3 mil millones de dólares. Estime el ingre- 
so en miles de millones de dólares que generó los impuestos a la venta y al ingreso individual. 

47. En 2006, Canadá exportó productos a Estados Unidos por un valor de 303.4 mil millones de dóla- 
res. Los cinco productos principales fueron: 


Producto 

Cantidad (miles de 
millones de dólares) 

Derivados del petróleo 

63.7 

Autos de pasajeros 

36.6 

Autopartes y accesorios 

15.6 

Aluminio 

7.7 

Madera 

6.6 


a) Utilice un paquete de software para desarrollar una gráfica de barras. 

b) ¿Qué porcentaje de las exportaciones totales de Canadá a Estados Unidos representan las 
categorías “Derivados del petróleo” y “Autos de pasajeros”? 

c) De los cinco principales productos de exportación, ¿qué porcentaje del total representan 
“Derivados del petróleo” y “Autos de pasajeros”? 
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48 . La vida en las granjas ha cambiado desde principios del siglo xx. En los primeros años del siglo 
xx, la maquinaria reemplazó gradualmente a la fuerza animal. Por ejemplo, en 1910 las granjas de 
Estados Unidos emplearon 24.2 millones de caballos y muías, y sólo alrededor de 1 000 tractores. 
En 1960 se empleaban 4.6 millones de tractores y sólo 3.2 millones de caballos y muías. En 1920 
había más de 6 millones de granjas en Estados Unidos. Hoy hay menos de 2 millones. En la lista 
que sigue aparece el número de granjas, en miles, en cada uno de los 50 estados. Redacte un 
párrafo en el que resuma sus hallazgos. 
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91 
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49 . Uno de los dulces más populares en Estados Unidos es el M&M, fabricado por Mars Company. Al 
principio, estos dulces eran todos cafés; ahora se fabrican en rojo, verde, azul, naranja, café y 
amarillo. Si desea leer la historia del producto, localizar ideas para preparar pasteles con él, com- 
prar los dulces en los diferentes colores de su escuela o equipo favorito y conocer el porcentaje 
de cada color que contienen las bolsas normales, visite www.m-ms.com. Hace poco una bolsa de 
14 onzas de M&M en su presentación regular contenía 444 dulces distribuidos por colores de la 
siguiente manera: 130 cafés, 98 amarillos, 96 rojos, 35 anaranjados, 52 azules y 33 verdes. Elabore 
una gráfica que describa esta información y redacte un párrafo en el que resuma los resultados. 

50 . Durante un periodo de 30 días se registró el número de familias que usaron el servicio de guarde- 
ría de la YWCA de Minneápolis. Los resultados son los siguientes: m 
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a) Construya una distribución de frecuencias acumulativas. 

b) Diseñe una gráfica del polígono de frecuencias acumulativas. 

c) ¿Cuántos días registraron menos de 30 familias que utilizaron el servicio de guardería? 

d) ¿Cuál fue el nivel de ocupación 80% de los días? 


Ejercicios de lo bose de datos 

51 . Consulte los datos de inmobiliarias que aparecen en el apéndice A, al final del libro, los cuales con- 
tienen información sobre las casas vendidas en el área de Goodyear, Arizona, el año pasado. 
Seleccione un intervalo de clase apropiado, y organice los precios de venta en una distribución de 
frecuencias. Escriba un breve reporte que resuma sus resultados. Asegúrese de contestar las 
siguientes preguntas en dicho reporte. 

a) ¿Alrededor de qué valores tienden a acumularse los datos? 

b) ¿Cuál es el precio de venta más alto? ¿Cuál es el precio de venta más bajo? 

c) Elabore una distribución de frecuencias acumulativas. ¿Cuántas casas se vendieron en menos 
de $200 000? Calcule el porcentaje de casas que se vendieron en más de $220 000. ¿Qué por- 
centaje de casas se vendió en menos de $125 000? 

d) Remítase a la variable con respecto a los municipios. Elabore una gráfica de barras que mues- 
tre el número de casas vendidas en cada municipio. ¿Existen diferencias o el número de casas 
que se vendieron en cada municipio es más o menos igual? 

52 . Consulte los datos Baseball 2009, los cuales contienen información sobre los 30 equipos de las 
Ligas Mayores de Béisbol durante la temporada 2009. Seleccione un intervalo de clase apropiado 
y organice la información sobre los salarios de los equipos en una distribución de frecuencias. 

a) ¿Cuál es el salario típico de un equipo? ¿Cuál es el rango de salarios? 

£>) Comente la forma de la distribución. ¿Parece que alguno de los salarios de los equipos no se 
encuentra en línea con los demás? 

c) Diseñe una distribución de frecuencias acumulativas. ¿Cuarenta por ciento de los equipos 
pagan menos que cuál cantidad del salario total del equipo? ¿Cuántos equipos aproximada- 
mente tiene salarios totales inferiores a $80 000 000? 
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53. Consulte los datos de los autobuses del Distrito Escolar Buena. Seleccione la variable que se refie- 
re al número de millas que recorrieron el mes pasado, y organice estos datos en una distribución 
de frecuencias. 

a) ¿Cuál es la cantidad típica de millas recorridas? ¿Cuál es el rango? 

b) Comente la forma de la distribución. ¿Existen valores atípicos en términos de millas conduci- 
das? 

c) Diseñe una distribución de frecuencias acumulativas. ¿Cuarenta por ciento de los autobuses 
fueron conducidos durante menos de cuántas millas? ¿Cuántos autobuses fueron conducidos 
menos de 850 millas? 

cf) Consulte las variables con respecto al tipo de autobús y al número de asientos en cada uno. 
Elabore una gráfica de pastel de cada variable y comente sus hallazgos. 


Comandos de software 


1. Los comandos de Excel para construir la gráfica de pastel 
de la página 26 son los siguientes: 

a) Active la celda A 7 y escriba las palabras Uso de ventas. 
En las celdas A2 a A5 escriba Precios, Educación, 
Bonos y Gastos. 

b) Active la celda B1 y escriba Cantidad (millones de dóla- 
res) e introduzca los datos en las celdas B2 a B5. 
Cuando termine de Ingresar los datos en B5, oprima 

Enter. 

c) De la barra superior de pestañas, seleccione Inserí. De 
la gráfica de herramientas, seleccione Pie. Seleccione 
el tipo de gráfica en la esquina superior izquierda 2-D. 
Aparecerá una gráfica en blanco. 



cf) En la barra superior de Excel aparecerá una pestaña de 
Herramientas de la barra. Seleccione la opción Dise- 
ño. Elija Seleccionar Datos de la barra de herramien- 
tas. Aparecerá una ventana. De Rango de datos de la 
gráfica, seleccione con el mouse todas las celdas de 
Al a B5. Oprima OK. 

e) Haga clic en la gráfica de pastel. Oprima el botón dere- 
cho del mouse para que aparezca el menú de opciones. 
Seleccione Agregar etiquetas de datos, y desmarque 
todas las casillas marcadas en la caja de diálogo. 
Luego, seleccione Categoría, Porcentaje y Líneas 
principales. Haga clic en Cerrar. 

f ) Haga doble clic en el nombre de la gráfica y renómbre- 
la Gastos de la lotería de Ohio. 

2. Los comandos de MegaStat para distribuir frecuencias de 

la página 34 son: 

a) Abra Excel y del disco incluido seleccione Data Sets y 
seleccione el formato de Excel; diríjase al capítulo 2 y 
seleccione Datos Applewood. Haga clic en MegaStat, 
Frequency Distribution y seleccione Quantitative. 

b) En la caja de diálogo introduzca el rango de A1:A181, 
seleccione Equal width intervals, utilice 400 como 
amplitud del intervalo, 2000 como límite inferior del pri- 


mer intervalo, seleccione Histogram y en seguida haga 
clic en OK. 

3. Los comandos Excel del histograma de la página 38 son 

los siguientes: 

a) En la celda Al indique que la columna de datos se refie- 
re a la ganancia y B1 a la frecuencia. En las celdas A2 
a A9, inserte los puntos medios de las ganancias. En B2 
a B9 registre las frecuencias de clase. Cuando termine 
de ingresar los datos en la celda B9, oprima Enter. 

b) Con el ratón seleccione las celdas B2 a B9. 

c) De las pestañas, seleccione Insert. De las gráficas, 
seleccione Column, después la columna 2-D y elija el 
primer tipo de gráfica. Aparecerá un área de gráfica. 

cf) Cuando el área de gráfica está activa, aparece una pes- 
taña Chart Tools en la parte superior de la pantalla. 
Seleccione la pestaña Design, y después Data. En 
Horizontal (Category) Axis Labels, haga clic en Edit, 
seleccione las celdas A3 a A9 con el mouse y haga un 
doble clic en OK. El eje horizontal debe mostrar los 
puntos medios de la clase. 

e) Con Chart Tools desplegada arriba, seleccione la pes- 
taña Design. Seleccione Chart Layout. Seleccione el 
trazo base: 




f) Con Chart Tools desplegada arriba, seleccione la pes- 
taña Layout. Haga doble clic en Chart Title e ingrese el 
nombre adecuado. Después, en la misma pestaña 
Layout, seleccione Axis Titles. Usando Primary Verti- 
cal Axis Title, asigne el nombre Frecuencia al eje verti- 
cal y borre las palabras vertical axis. Mediante Primary 
Horizontal Axis Title, nómbrelo Profit (dólares). 
Seleccione Legend y en seguida None. 

g) Haga doble clic en una de las columnas de la gráfica. 
Seleccione Layout de las pestañas de arriba. Haga clic 
sobre las palabras Format Selection en la izquierda de 
la barra de herramientas. Aparecerá una caja de diálo- 
go. En Series Option, cambie el Gap Width a 0% y des- 
place la flecha completamente hacia la izquierda, haga 
clic en Cióse en la parte inferior de la caja de diálogo. 
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Capítulo 2 


Respuestas a las autoevaluaciones 



2-1 a) Datos cualitativos, ya que la respuesta de los consu- 
midores a la prueba de degustación es el nombre de 
una bebida. 

b) Tabla de frecuencias. Ésta muestra el número de 
personas que prefiere cada una de las bebidas. 



d) 



2-2 a) Los datos brutos o datos no agrupados. 


Comisión 

Número de 
vendedores 

$1400 a $1500 

2 

1500 a 1600 

5 

1600 a 1700 

3 

1700 a 1800 

1 

Total 

11 


c) Frecuencias de clase. 

d) La concentración más grande de comisiones se 
encuentra entre $1 500 y $1 600. La comisión más 
pequeña es de aproximadamente $1 400 y la más 
grande de casi $1 800. La cantidad típica que se 
obtuvo fue de $15 500. 

2-3 a) 2 6 = 64 < 73 < 128 = 2 7 . Así que se recomiendan 7 
clases. 

b) La amplitud del intervalo debería ser de por lo 
menos (488 - 320)/7 = 24. Los intervalos de clase 
de 25 a 30 pies son razonables. 

c) Si se utiliza un intervalo de clase de 25 pies y se 
comienza con un límite inferior de 300 pies, serían 
necesarias ocho clases. Un intervalo de clase de 30 
pies que comience con 300 pies también es razona- 
ble. Esta alternativa requiere sólo siete clases. 

2-4 a) 45 
b) 0.250 

b) 0.306, calculado de la siguiente manera: 0.178 + 
0.106 + 0.022 

2-5 a) 

20 

-S E 15 
2 -§ 

| | 10 
'=3 O 

5 
0 

Importaciones (millones de dólares) 



2 5 8 11 14 17 


b) 


40 
30 
20 
10 
0 

2 5 8 11 14 17 

Importaciones (millones de dólares) 



Las puntos son: (3.5, 12), (6.5, 26), (9.5, 40), (12.5, 20) 
y (15.5, 2). 

c) El mínimo volumen anual de importaciones por parte 
de un proveedor es de aproximadamente $2 millo- 
nes, el máximo, de $17 millones. La frecuencia más 
alta se encuentra entre $8 millones y $1 1 millones. 
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2-6 a) Una distribución de frecuencias. 


Salarios por hora 

Número acumulado 

Menos de $8 

0 

Menos de $1 0 

3 

Menos de $1 2 

10 

Menos de $14 

14 

Menos de $16 

15 



c) Alrededor de siete empleados ganan $1 1 .00 o 
menos. 

Cerca de la mitad de los empleados gana $1 1 .25 o 
más. 

Alrededor de cuatro empleados gana $10.25 o 
menos. 



Descripción de datos 

Medidas numéricas 


Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



OA1 Explicar el concepto de 
tendencia central. 



El Derby de Kentucky se celebra el primer sábado de mayo en 
Churchill Downs, Loulsvllle, Kentucky. La pista mide una milla y cuarto. 
La tabla del ejercicio 82 muestra los ganadores desde 1990, su 
margen de victoria, el tiempo del ganador, y las ganancias sobre una 
apuesta de 2 dólares. Determine la media y la mediana de estas dos 
últimas variables (vea ejercicio 82 y objetivo 4). 


OA2 Identificar y calcular la 
media aritmética. 

OA3 Calcular e Interpretar la 
media ponderada. 

OA4 Determinar la mediana. 

OA5 Identificar la moda. 

OA6 Calcular la media 
geométrica. 

OA7 Explicar y aplicar 
medidas de dispersión. 

OA8 Calcular e Interpretar la 
varianza y la desviación 
estándar. 

OA9 Explicar el teorema de 
Chebyshev y la regla empírica. 

OAIO Calcular la media y la 
desviación estándar de datos 
agrupados. 


58 


CAPÍTULO 3 Descripción de datos: medidas numéricas 


OA1 Explicar el concepto de 
tendencia central. 



Estadística en acción 

¿Se ha topado alguna vez 
con un estadounidense 
promedio? Pues bien, se 
llama Robert (nivel nomi- 
nal de la medición); tiene 
31 años (nivel de razón); 
mide 1.77 metros (otro 
nivel de razón de la 
medición); pesa 78 kilo- 
gramos; calza del 9 Vi ; su 
cintura mide 85 cm de 
diámetro y viste trajes 
talla 40. Además, el hom- 
bre promedio come 1.8 
kg de papas fritas; mira 
2 567 horas el televisor y 
se come 1 1.77 kg de plá- 
tanos al año, además de 
que duerme 7.7 horas 
cada noche. 

La estadounidense pro- 
medio mide 1.64 metros 
de estatura y pesa 64 kg, 
mientras que la modelo 
estadounidense promedio 
mide 1.65 metros y pesa 
53 kg. Un día cualquiera, 
casi la mitad de las muje- 
res en Estados Unidos 
está a dieta. Idolatrada en 
la década de los cincuen- 
ta, Marilyn Monroe se 
consideraría con sobrepe- 
so según los estándares de 
hoy. Usaba vestidos de las 
tallas 14 a la 18, y era 
una mujer saludable y 
atractiva. 


3.1 Introducción 

En el capítulo 2 iniciamos el estudio de la estadística descriptiva. Para transformar un cúmulo 
de datos en bruto en algo con significado, organizamos los datos cuantitativos en una distri- 
bución de frecuencias y después representamos los resultados en una gráfica de barras. De 
manera similar organizamos los datos cuantitativos en una distribución de frecuencias y los 
presentamos gráficamente en un histograma. Aprendimos otras técnicas para graficar, como 
las gráficas de pastel para representar datos cualitativos, y polígonos de frecuencias para 
representar datos cuantitativos. 

En este capítulo se presentan dos formas numéricas de describir datos cuantitativos: las 
medidas de ubicación y las medidas de dispersión. A las medidas de ubicación a menudo 
se les llama promedios. El propósito de una medida de ubicación consiste en señalar el cen- 
tro de un conjunto de valores. Usted está familiarizado 
con el concepto de promedio, medida de ubicación que 
muestra el valor central de los datos. Los promedios 
aparecen a diario en televisión, en el periódico y otras 
publicaciones. He aquí algunos ejemplos: 

• La casa promedio en Estados Unidos cambia de 
dueño cada 11.8 años. 

• Un estadounidense recibe un promedio de 568 pie- 
zas de correspondencia cada año. 

• El hogar estadounidense promedio tiene más televi- 
sores que personas. Hay 2.73 televisores y 2.55 
personas en el hogar típico. 

• La pareja estadounidense promedio gasta 20 398 
dólares en su boda, mientras que su presupuesto es 
50% menor. Esta cifra no incluye el costo de la luna 
de miel ni del anillo de compromiso. 

• El precio promedio de un boleto de teatro en Esta- 
dos Unidos es de 7.50 dólares, según la Asociación 
Nacional de Propietarios de Teatros. 

Si sólo toma en cuenta las medidas de ubicación de un conjunto de datos o si compara 
varios conjuntos de datos utilizando valores centrales, llegará a una conclusión incorrecta. 
Además de las medidas de ubicación, debe tomar en consideración la dispersión —denomi- 
nada con frecuencia variación o propagación— de los datos. Por ejemplo, suponga que el 
ingreso anual promedio de los ejecutivos de compañías relacionadas con internet es de 
$80 000, igual que el ingreso promedio de ejecutivos de compañías farmacéuticas. Si sólo 
atiende a los ingresos promedio, podría concluir, equivocadamente, que las dos distribuciones 
de salarios son idénticas o casi idénticas. Un vistazo a los rangos salariales indica que esta 
conclusión no es correcta. Los salarios de los ejecutivos de las empresas de internet oscilan 
entre $70 000 y $90 000; en cambio, los salarios de los ejecutivos de marketing de la indus- 
tria farmacéutica van de $40 000 a $120 000. Por consiguiente, aunque los salarios promedios 
son los mismos en las dos industrias, hay más propagación o dispersión en los que perciben 
los ejecutivos de la industria farmacéutica. Para describir la dispersión considere el rango, la 
desviación media, la varianza y la desviación estándar. 

En principio se explican las medidas de ubicación. No existe una única medida de disper- 
sión; de hecho, existen varias. Consideraremos cinco: la media aritmética, la media pondera- 
da, la mediana, la moda y la media geométrica. La media aritmética es la medida de ubicación 
que más se utiliza y que se publica con mayor frecuencia, por lo cual se le considerará como 
parámetro para una población y como estadístico para las muestras. 

3.2 La media poblacional 

Muchos estudios incluyen todos los valores que hay en una población. Por ejemplo, la tienda 
de menudeo Reynolds Road, de Carpets by Otto, tiene 12 empleados. El monto promedio de 
comisiones que ganaron el mes pasado fue de $1 345. Éste es el valor poblacional, puesto 
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que considera la comisión de todos los asociados de ventas. Otros ejemplos de media pobla- 
cional serían los siguientes: 

• El precio de cierre promedio de las acciones de Johnson & Johnson durante los últimos 5 
días es de $64.75. 

• La semana pasada, los seis soldadores del departamento de soldadura de Butts Welding, 
Inc., trabajaron, en promedio, 6.45 horas extras. 

• Caryn Tirsch inició el mes pasado un sitio web dedicado a la jardinería orgánica. La media 
aritmética de visitas a su sitio durante los 31 días de julio fue de 84.36. 

En el caso de los datos en bruto, que no han sido agrupados en una distribución de fre- 
cuencias, la media pobiacional es la suma de todos los valores observados en la población 
dividida entre el número de valores de la población. Para determinar la media pobiacional, apli- 
que la siguiente fórmula: 


Media pobiacional 


Suma de todos los valores observados en la población 
Número de valores en la población 


0A2 Identificar y calcular la 
media aritmética. 


En lugar de escribir las instrucciones completas para calcular la media pobiacional (o cual- 
quier otra medida), resulta más conveniente utilizar símbolos matemáticos adecuados. La 
media de una población con símbolos matemáticos es: 


MEDIA POBLACIONAL 

V 



(3-1) 


en la cual: 

pe representa la media pobiacional; se trata de la letra minúscula griega mu. 
N es el número de valores en la población. 

X representa cualquier valor particular. 

X es la letra mayúscula griega sigma e indica la operación de suma. 

XX es la suma de X valores en la población. 


Cualquier característica medióle de una población recibe el nombre de parámetro. La media 
de una población es un parámetro. 


r 


PARÁMETRO Característica de una población. 




Cjemplo 


Solución 


Hay 42 salidas en la 1-75 que atraviesa el estado de Kentucky. A continuación aparece la lista 
de distancias entre salidas (en millas). 


11 

4 

10 

4 

9 

3 

8 

10 

3 

14 

1 

10 

3 

5 

2 

2 

5 

6 

1 

2 

2 

3 

7 

1 

3 

7 

8 

10 

1 

4 

7 

5 

2 

2 

5 

1 

1 

3 

3 

1 

2 

1 


¿Por qué esta información representa una población? ¿Cuál es la media aritmética de millas 
entre salidas? 


Es una población porque se toma en cuenta a todas las salidas en Kentucky. Sume las distan- 
cias entre cada una de las 42 salidas. La distancia total es de 192 millas. Para determinar la 
media aritmética, divida este total entre 42. Así, la media aritmética es 4.57 millas, calculada 
mediante la operación 192/42. De acuerdo con la fórmula (3-1): 


XX _ 11 + 4 + 10 + • • ■ + 1 _ 192 

" 77 " ~ 42 ~~ "42” 


4.57 


¿Cómo interpretar el valor 4.57? Es el número típico de millas entre salidas. Como se ha 
tomado en cuenta a todas las salidas de Kentucky, este valor es un parámetro pobiacional. 
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3.3 Media de una muestra 



Como se explicó en el capítulo 1 , con frecuencia se selecciona una muestra de 
la población para estimar una característica específica de la población. Por 
ejemplo, el departamento de aseguramiento de la calidad de Smucker’s nece- 
sita cerciorarse de que la cantidad de mermelada de fresa en un recipiente 
cuya etiqueta Indica que contiene 12 onzas, realmente contenga dicha canti- 
dad. Sería muy costoso y lento revisar el peso de cada recipiente. Por lo tanto, 
se selecciona una muestra de 20 recipientes, se determina la media de ella, y 
se utiliza ese valor para calcular la cantidad de mermelada que hay en cada 
recipiente. 

En el caso de los datos en bruto, de los datos no agrupados, la media es 
la suma de los valores de la muestra, divididos entre el número total de valores 
de la muestra. La media de una muestra se determina de la siguiente manera: 


Media de datos no agrupados 
de una muestra. 


Media de la muestra = 


Suma de todos los valores de la muestra 
Número de valores de la muestra 


r 


MEDIA DE UNA MUESTRA 





(3-2) 


donde: 

X es la media de la muestra; se lee: X barra, 
n es el número de valores de la muestra. 

X representa cualquier valor particular. 

X es la letra mayúscula griega sigma e indica la operación de suma. 

EX es la suma de X valores de la muestra. 

La media de una muestra o cualquier otra medición basada en una muestra de datos reci- 
be el nombre de estadístico. SI el peso promedio de una muestra de 10 contenedores de mer- 
melada de fresa Smucker’s es de 41 onzas, se trata de un ejemplo de estadístico. 


d 


ESTADÍSTICO Característica de una muestra. 


3 


r 

Cjemplo 

SunCom estudia la cantidad de minutos que consumen sus clientes que cuentan con un plan 
tarifario de cierto teléfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente can- 


tidad de minutos empleados el mes pasado. 

90 77 94 89 119 112 

91 110 92 100 113 83 

¿Cuál es el valor de la media aritmética de los minutos consumidos? 

Solución 

De acuerdo con la fórmula (3-2), la media muestral es: 

Suma de todos los valores en la muestra 

Media muestral - 

Numero de valores en la muestra 

- 2X 90 + 77 + • • • + 83 1170 

n 12 12 

El valor de la media aritmética de los minutos consumidos el mes pasado por los usuarios de 
teléfonos celulares de la muestra es de 97.5 minutos. 
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La media como punto de 
equilibrio. 


La media se ve afectada en 
exceso por valores inusual- 
mente grandes o pequeños. 


3.4 Propiedades de la media aritmética 

La media aritmética es una medida de ubicación muy utilizada. Cuenta con algunas propieda- 
des importantes: 

1 . Todo conjunto de datos de intervalo —o de nivel de razón— posee una media. 

Recuerde del capítulo 1 que los datos del nivel de razón incluyen datos como edades, 
ingresos y pesos, y que la distancia entre los números es constante. 

2. Todos los valores se encuentran incluidos en el cálculo de la media. 

3. La media es única. Sólo existe una media en un conjunto de datos. Más adelante en el 
capítulo descubrirá un promedio que podría aparecer dos o más veces en un conjunto de 
datos. 

4. La suma de las desviaciones de cada valor de la media es cero. Expresado simbólica- 
mente, 


2(X - X) = 0 

Como ejemplo, la media de 3, 8 y 4 es 5. De esta manera: 

2(X - X) = (3 - 5) + (8 - 5) + (4 - 5) 

= -2 + 3 - 1 
= 0 

De esta manera la media es un punto de equilibrio de un conjunto de datos. Para ilustrar- 
lo, imagine una regla con los números 1, 2, 3, ..., 9 uniformemente espaciados. Suponga que 
se colocaran tres barras del mismo peso sobre la regla en los números 3, 4 y 8 y que el punto 
de equilibrio se colocara en 5, la media de los tres números. Descubriría que la regla se equi- 
libra perfectamente. Las desviaciones debajo de la media (—3) son iguales a las desviaciones 
por encima de la media (+3). El esquema es: 



La media tiene un punto débil. Recuerde que el valor de cada elemento de una muestra, 
o población, se utiliza cuando se calcula la media. Si uno o dos de estos valores son extrema- 
damente grandes o pequeños comparados con la mayoría de los datos, la media podría no 
ser un promedio adecuado para representar los datos. Por ejemplo, suponga que los ingresos 
anuales de un pequeño grupo de corredores de bolsa en Merrill Lynch es de $62 900, $61 600, 
$62 500, $60 800 y $1 200 000. El ingreso medio es de $289 560; claro, no es representativo 
del grupo, ya que todos, salvo un corredor, tienen ingresos entre $60 000 y $63 000. Un ingre- 
so ($1.2 millones) afecta en exceso la media. 
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Autoevaluación 


3-1 


1 . Los ingresos anuales de una muestra de empleados de administración media 
en Westinghouse son: $62 900, $69 100, $58 300 y $76 800. 

a) Proporcione la fórmula de la media muestra!. 
tí) Determine la media muestral. 

c) ¿Es la media que calculó en el inciso tí) un estadístico o un parámetro? ¿Por qué razón? 

d) ¿Cuál es su mejor aproximación de la media de la población? 

2. Todos los estudiantes de Ciencias Avanzadas de la Computación de la clase 41 1 constituyen una 
población. Sus calificaciones en el curso son de 92, 96, 61, 86, 79 y 84. 

a) Proporcione la fórmula de la media poblacional. 
tí) Calcule la calificación media del curso. 

tí) ¿Es la media que calculó en el inciso tí) un estadístico o un parámetro? ¿Por qué razón? 
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Ejercicios 

Las respuestas a los ejercicios impares se encuentran al final del libro. 

1. Calcule la media de la siguiente población de valores: 6, 3, 5, 7, 6. 

2. Calcule la media de la siguiente población de valores: 7, 5, 7, 3, 7, 4. 

3. a) Calcule la media de los siguientes valores muéstrales: 5, 9, 4, 10. 
ib) Demuestre que 2(X - X) = 0. 

4. a) Calcule la media de los siguientes valores muéstrales: 1.3, 7.0, 3.6, 4.1, 5.0. 
b) Demuestre que 2(X - X) = 0. 

5. Calcule la media de los siguientes valores muéstrales: 16.25, 12.91, 14.58. 

6. Suponga que va a la tienda y gasta $61.85 en 14 artículos. ¿Cuál es el precio promedio por ar- 
tículo? 


En los ejercicios 7 a 10, a) calcule la media aritmética y tí) indique si se trata de un estadístico o de un 
parámetro. 

7. Midtown Ford emplea a 10 vendedores. El número de automóviles nuevos que vendieron el mes 
pasado los respectivos vendedores fue: 15, 23, 4, 19, 18, 10, 10, 8, 28, 19. 

8. El departamento de contabilidad en una compañía de ventas por catálogo contó las siguientes 
cantidades de llamadas recibidas por día en el número gratuito de la empresa durante los prime- 
ros 7 días de mayo de 2006: 14, 24, 19, 31, 36, 26, 17. 

9. Cambridge Power and Light Company seleccionó una muestra aleatoria de 20 clientes residencia- 
les. En seguida aparecen las sumas, redondeadas al dólar más próximo, que se cobraron a los 
clientes por el servicio de luz el mes pasado: m 


54 

48 

58 

50 

25 

47 

75 

46 

60 

70 

67 

68 

39 

35 

56 

66 

33 

62 

65 

67 


10. El director de relaciones humanas de Ford inició un estudio de las horas de trabajo extra en el 
Departamento de Inspección. Una muestra de 15 trabajadores reveló que éstos laboraron la 
siguiente cantidad de horas extras el mes pasado. 


13 

13 

12 

15 

7 

15 

5 

12 

6 

7 

12 

10 

9 

13 

12 



11. AAA Fleating and Air Conditioning concluyó 30 trabajos el mes pasado con un ingreso medio de 
$5 430 por trabajo. El presidente desea conocer el ingreso total del mes. Con base en la informa- 
ción limitada que se proporciona, ¿puede calcular el ingreso total? ¿A cuánto asciende? 

12. Una gran compañía farmacéutica contrata graduados de administración de empresas para vender 
sus productos. La compañía se expande con rapidez y dedica un día a capacitar a los nuevos ven- 
dedores. El objetivo que la compañía fija a cada nuevo vendedor es de $10 000 mensuales, cifra 
que refleja las ventas promedio actuales por mes de la empresa. Después de revisar las retencio- 
nes de impuestos de los nuevos empleados, la compañía encuentra que sólo 1 de cada 10 per- 
manece más de tres meses en la empresa. Comente la utilización de las ventas promedio actua- 
les mensuales como objetivo de ventas para los nuevos empleados. ¿Por qué abandonan los 
empleados la compañía? 


3.5 Media ponderada 
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OA3 Calcular e interpretar 
la media ponderada. 


3.5 Media ponderada 

La media ponderada, que constituye un caso especial de la media aritmética, se presenta 
cuando hay varias observaciones con el mismo valor. Para entender este tema, suponga que 
el Wendy’s Restaurant vende refrescos medianos, grandes y gigantes a $0.90, $1 .25 y $1 .50. 
De las 10 últimas bebidas que se vendieron 3 eran medianas, 4 grandes y 3 gigantes. Para 
determinar el precio promedio de las últimas 10 bebidas vendidas recurra a la fórmula (3-2). 


X = 
X = 


$.90 + $.90 + $.90 + $1 .25 + $1 .25 + $1 .25 + $1 .25 + $1 .50 + $1 .50 + $1 .50 


$12.20 

10 


$1.22 


10 


El precio promedio de venta de las últimas 10 bebidas es de $1.22. 

Una forma más fácil de calcular el precio promedio de venta consiste en determinar la 
media ponderada: multiplique cada observación por el número de veces que aparece. La 
media ponderada se representa como X m , que se lee: “X subíndice w”. 

- 3($0.90) + 4($1.25) + 3($1.50) $12.20 _ 00 

x " io “ To “ $1 ' 22 

En este caso, las ponderaciones son conteos de frecuencias. Sin embargo, cualquier medida 
de importancia podría utilizarse como una ponderación. En general, la media ponderada del 
conjunto de números representados como X-¡, X 2 , X 3 , ..., X n con las ponderaciones correspon- 
dientes w |, w 2 , tv 3 , , w n , se calcula de la siguiente manera: 


r 


MEDIA PONDERADA 


V 


X... 


+ w 2 X 2 + w 3 X 3 + ■ ■ ■ + w n X n 
w, + tv„ + w„ + ■ ■ ■ + w 

12 3 n 


(3-3) 


Que se abrevia de la siguiente manera: 

_ S(wX) 

w 

Observe que el denominador de una media ponderada siempre es la suma de las pondera- 
ciones. 


r 

Cjemplo 

Cárter Construction Company paga a sus empleados que trabajan por hora $16.50, $19.00 0 
$25.00. Hay 26 empleados contratados para trabajar por hora, 14 de los cuales reciben la tari- 


fa de $16.50; 10 la tarifa de $19.00 y 2 la de $25.00. ¿Cuál es la tarifa promedio por hora que 
se paga a los 26 empleados? 

Solución 

Para determinar la tarifa media por hora, multiplique cada una de las tarifas por hora por el 
número de empleados que ganan dicha tarifa. De acuerdo con la fórmula (3-3), la tarifa media 


por hora es 


- 1 4($1 6.50) + 1 0($1 9.00) + 2($25.00) $471 .00 . 

X — — — $1 8.1 1 54 

w 14 + 10 + 2 26 


El salario promedio ponderado por hora se redondea a $18.12. 



Springers vendió 95 trajes para caballero Antonelli a un precio normal de $400. Durante la venta de 
primavera rebajaron los trajes a $200 y vendieron 126. Al final de la venta de liquidación, redujeron 
el precio a $100 y se vendieron los restantes 79 trajes. 

a) ¿Cuál fue el precio promedio ponderado de un traje Antonelli? 

b) Springers pagó $200 por cada uno de los 300 trajes. Haga algún comentario sobre la ganancia 
de la tienda por traje, si un vendedor recibe $25 de comisión por cada uno que vende. 
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comed: 


OA4 Determinar la 
mediana. 


Ejercicios 

13. En junio, una inversionista compró 300 acciones de Oracle (una compañía de tecnología de la 
información) a $20 cada una. En agosto compró 400 acciones más a $25. En noviembre compró 
otras 400 acciones, pero el precio bajó a $23 cada título. ¿Cuál es el precio promedio ponderado 
de cada acción? 

14. Bookstall, Inc., es una librería especializada que se dedica a la venta de libros usados por internet. 
Los libros de pasta blanda cuestan $1 .00 cada uno y los de pasta dura, $3.50 cada uno. De los 50 
libros que se vendieron el pasado martes por la mañana, 40 eran de pasta blanda y el resto de 
pasta dura. ¿Cuál fue el precio promedio ponderado de un libro? 

15. Loris Healthcare System tiene 200 empleados en su personal de enfermería. Cincuenta son auxi- 
liares de enfermería; 50 enfermeras practicantes, y 100 son enfermeras tituladas. Las auxiliares de 
enfermería ganan $8 la hora; las enfermeras practicantes $15 y las tituladas $24 la hora. ¿Cuál es 
el salario promedio ponderado por hora? 

16. Andrews and Associates se especializa en leyes empresariales. Cobran $100 la hora de investiga- 
ción de un caso; $75 la hora de asesoría y $200 la hora de redacción de un expediente. La sema- 
na pasada uno de los socios dedicó 10 horas a dar asesoría a una dienta, 10 horas a investigar el 
caso y 20 horas a la redacción del expediente. ¿Cuál fue el monto medio ponderado por hora de 
honorarios por servicios legales? 


3.6 Mediana 

Ya se ha insistido en que si los datos contienen uno o dos valores muy grandes o muy peque- 
ños, la media aritmética no resulta representativa. Es posible describir el centro de dichos 
datos a partir de una medida de ubicación denominada mediana. 

Para ilustrar la necesidad de una medida de ubicación diferente de la media aritmética, 
suponga que busca un condominio en Palm Aire. Su agente de bienes raíces le dice que el 
precio típico de las unidades disponibles en este momento es de $110 000. ¿Aún insiste en 
seguir buscando? Si usted se ha fijado un presupuesto máximo de $75 000, podría pensar que 
los condominios se encuentran fuera de su presupuesto. Sin embargo, la verificación de los 
precios de las unidades individuales podría hacerle cambiar de parecer. Los costos son de 
$60 000, $65 000, $70 000, $80 000 y de $275 000 en el caso de un lujoso penthouse. El 
importe promedio aritmético es de $1 1 0 000, como le informó el agente de bienes raíces, pero 
un precio ($275 000) eleva la media aritmética y lo convierte en un promedio no representati- 
vo. Parece que un precio de poco más o menos $70 000 es un promedio más típico o repre- 
sentativo, y así es. En casos como éste, la mediana proporciona una medida de ubicación más 
válida. 


r 


MEDIANA Punto medio de los valores una vez que se han ordenado de menor a mayor o de 
mayor a menor. 


El precio mediano de las unidades disponibles es de $70 000. Para determinarlo, ordene 
los precios de menor ($60 000) a mayor ($275 000) y seleccione el valor medio ($70 000). En 
el caso de la mediana los datos deben ser por lo menos de un nivel ordinal de medición. 


Precios ordenados 
de menor a mayor 

Precios ordenados 
de mayor a menor 

$ 60 000 

$275 000 

65 000 

80 000 

70 000 <- Mediana -> 70 000 

80 000 

65 000 

275 000 

60 000 


3.7 Moda 
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A la mediana le afectan 
menos los valores extremos. 


Cjemplo 


Solución 




La mediana se determina 
para cualquier nivel de datos, 
excepto los nominales. 


OA5 Identificar la moda. 


Observe que existe el mismo número de precios bajo la mediana de $70 000 que sobre 
ella. Por consiguiente, a la mediana no le afectan precios bajos o altos. Si el precio más 
alto fuera de $90 000 o de $300 000, incluso de $1 000 000, el precio mediano aún sería de 
$70 000. Asimismo, si el precio más bajo fuera de $20 000 o $50 000, el precio mediano toda- 
vía sería de $70 000. 

En el ejemplo anterior hay un número impar de observaciones (cinco). ¿Cómo se determi- 
na la mediana en el caso de un número par de observaciones? Como antes, se ordenan las 
observaciones. En seguida, con el fin de obtener un único valor por convención, calcule la 
media de las dos observaciones medias. Así, en el caso de un número par de observaciones, 
la mediana quizá no sea uno de los valores dados. 


Facebook es una popular red social en internet. Los usuarios pueden agregar amigos y enviar- 
les mensajes, así como actualizar sus perfiles personales para informar a sus amigos sobre sí 
mismos y sus actividades. Una muestra de 10 adultos reveló que pasaron los siguientes núme- 
ros de horas utilizando Facebook el mes pasado. 


35759139 17 10 


Encuentre la media aritmética de horas. 

Observe que el número de adultos muestreados es par (10). Como antes, el primer paso es 
ordenar las horas durante las cuales se usó Facebook de menor a mayor. Identifique los dos 
tiempos medios. La media aritmética de las dos observaciones del medio nos da la mediana 
de horas. Si organizamos los valores de menor a mayor tenemos que: 


13355799 10 17 


Para encontrar la media se promedian los dos valores centrales, que en este caso son 5 y 7 
horas; la media de estos dos valores es 6. Se concluye que el usuario de Facebook típico pasa 
6 horas al mes en el sitio. Observe que la mediana no es uno de los valores. Asimismo, la mitad 
de los tiempos se encuentran por debajo de la mediana y la mitad sobre ella. 


Las principales propiedades de la mediana son las siguientes: 

1 . No influyen en ella valores extremadamente grandes o pequeños. Por consiguiente, la 
mediana es una valiosa medida de ubicación cuando dichos valores se presentan. 

2. Es calculable en el caso de datos de nivel ordinal o más altos. Recuerde del capítu- 
lo 1 que los datos de nivel ordinal pueden ordenarse de menor a mayor. 

3.7 Moda 

La moda es otra medida de ubicación. 


(! 


MODA Valor de la observación que aparece con mayor frecuencia. 


J 


La moda es de especial utilidad para resumir datos de nivel nominal. Un ejemplo de esta 
aplicación en datos de nivel nominal: una compañía creó cinco aceites para baño. La gráfica 
3-1 muestra los resultados de una encuesta de mercado que se diseñó para determinar qué 
aceite para baño prefieren los consumidores. La mayoría de los encuestados se inclinó por 
Lamoure, según lo evidencia la barra más grande. Por consiguiente, Lamoure representa la 
moda. 
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GRÁFICA 3-1 Número de encuestados que prefieren ciertos aceites para baño 


Cjemplo 


Solución 


Recuerde los datos con respecto a la distancia en millas entre las salidas en la 1-75 que atra- 
viesa Kentucky. Esa información se repite a continuación. 



¿Cuál es la distancia modal? 

El primer paso es organizar las distancias en una tabla de frecuencias. Esta tarea le ayudará a 
determinar la distancia que se presenta más a menudo. 


Distancia en millas entre salidas 

Frecuencia 

1 

8 

2 

7 

3 

7 

4 

3 

5 

4 

6 

1 

7 

3 

8 

2 

9 

1 

10 

4 

11 

1 

14 

1 

Total 

42 


La distancia que se presenta con mayor frecuencia es una milla. Se repite ocho veces, es 
decir, hay 8 salidas separadas por una milla. Así que la distancia modal entre salidas es una 
milla. 

¿Cuál de estas tres medidas de ubicación (media, mediana o moda) representa mejor la 
ubicación central de estos datos? ¿Es la moda la mejor medida de ubicación para representar 
los datos de Kentucky? No. La moda sólo toma en cuenta la escala nominal de medición, y la 




3.7 Moda 


67 


variable millas se mide utilizando la escala de razón. Se ha calculado que la media es de 4.57 
millas. Vea la página 59. ¿Es la media la mejor medida de ubicación para representar estos 
datos? Probablemente no. Hay muchos casos en que la distancia entre salidas es larga. Estos 
valores afectan la media, pues la hacen demasiado grande y no representativa de las distan- 
cias entre salidas. ¿Y qué hay de la mediana? La distancia mediana es de 3 millas. Esto es, la 
mitad de las distancias entre salidas son de 3 millas o menos. En este caso, la mediana de 3 
millas entre salidas probablemente es una medida más representativa. 


En resumen, es posible determinar la moda para todos los niveles de datos: nominal, ordi- 
nal, de Intervalo y de razón. La moda también tiene la ventaja de que no influyen en ella valo- 
res extremadamente grandes o pequeños. 

Desventajas de la moda. No obstante, la moda tiene sus desventajas, por las cuales se le utiliza con menor frecuen- 

cia que a la media o la mediana. En el caso de muchos conjuntos de datos no existe la moda, 
porque ningún valor se presenta más de una vez. Por ejemplo, no hay moda en el siguiente 
conjunto de datos de precios: $1 9, $21 , $23, $20 y $1 8. Sin embargo, como cada valor es dife- 
rente, podría argumentar que cada valor es la moda. Por el contrario, en el caso de 
algunos conjuntos de datos hay más de una moda. Suponga que las edades de los miembros 
de un club de inversionistas son 22, 26, 27, 27, 31, 35 y 35. Las edades 27 y 35 son modas. 
Así, este agrupamiento de edades se denomina bimodal (tiene dos modas). Alguien podría 
cuestionar la utilización de dos modas para representar la ubicación de este conjunto de datos 
de edades. 



1 . Una muestra de personas solteras, residentes en Towson, Texas, que reciben pagos por segu- 
ridad social reveló los siguientes subsidios mensuales: $852, $598, $580, $1 374, $960, $878 y 
$1 130. 

a) ¿Cuál es la mediana del subsidio mensual? 

b) ¿Cuántas observaciones se encuentran debajo de la mediana? ¿Por encima de ella? 

2. El número de interrupciones de trabajo en la industria del automóvil en meses muestreados son 
de 6, 0, 10, 14, 8 y 0. 

a) ¿Cuál es la mediana del número de interrupciones? 

b) ¿Cuántas observaciones se encuentran por debajo de la mediana? ¿Por encima de ella? 

c) ¿Cuál es el número modal de interrupciones de trabajo? 
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Ejercicios 

17. ¿Qué informaría usted como valor modal de un conjunto de observaciones si hubiera un total de: 

a) 10 observaciones y no hubiera dos valores iguales; 

b) 6 observaciones, todas iguales; 

c) 6 observaciones con valores de 1 , 2, 3, 4 y 4? 

En los ejercicios 18 a 20, determine a) la media, b) la mediana y c) la moda. 

18. Los siguientes son los números de cambios de aceite de los últimos 7 días en Jiffy Lube, que se 
ubica en la esquina de Elm Street y Pennsylvania Avenue. 


41 

15 

39 

54 

31 

15 

33 


19. El siguiente es el cambio porcentual en el ingreso neto del año pasado al presente en una mues- 
tra de 12 compañías constructoras de Denver. 


5 

1 

-10 

-6 

5 

12 

7 

8 

2 

5 

-1 

11 


20. Las siguientes son las edades de 10 personas que se encuentran en la sala de videojuegos del 
Southwyck Shopping Malí a las 10 de la mañana. 


12 

8 

17 

6 

11 

14 

8 

17 

10 

8 
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21. Abajo se enlistan diversos indicadores dei crecimiento económico a largo plazo de Estados Uni- 
dos. SIS 


Indicador económico 

Cambio porcentual 

Indicador económico 

Cambio porcentual 

Inflación 

4.5% 

PNB real 

2.9% 

Exportaciones 

4.7 

Inversión (residencial) 

3.6 

Importaciones 

2.3 

Inversión (no residencial) 

2.1 

Ingreso real disponible 

2.9 

Productividad (total) 

1.4 

Consumo 

2.7 

Productividad (fabricación) 

5.2 


a) ¿Cuál es la mediana del cambio porcentual? 

b) ¿Cuál es el cambio porcentual modal? 

22. Sally Reynolds vende bienes raíces en el área costera de California del Norte. En seguida se mues- 
tra la cantidad total de las comisiones que ha ganado desde 2000. Encuentre la media, la media- 
na y la moda de las comisiones que ha ganado en los 1 1 años. m 


Año 

Cantidad (miles) 

2000 

$237.51 

2001 

233.80 

2002 

206.97 

2003 

248.14 

2004 

164.69 

2005 

292.16 

2006 

269.11 

2007 

225.57 

2008 

255.33 

2009 

202.67 

2010 

206.53 


23. La empresa de contabilidad de Rowatti y Koppel se especializa en la elaboración de declaracio- 
nes del impuesto sobre la renta de profesionales independientes, como médicos, dentistas, arqui- 
tectos y abogados. La firma emplea a 1 1 contadores que preparan declaraciones. El año pasado, 
el número de declaraciones que elaboró cada contador fue la siguiente: 


58 

75 

31 

58 

46 

65 

60 

71 

45 

58 

80 


Determine la media, la mediana y la moda de los números de declaraciones que elaboró cada con- 
tador. Si usted elaborara una, ¿qué medida de ubicación recomendaría? 

24. La demanda de videojuegos que suministra Mid-Tech Video Games, Inc., se ha disparado en los 
últimos siete años. De ahí que el propietario requiera contratar técnicos que se mantengan a la par 
con la demanda. Mid-Tech proporciona a cada solicitante una prueba que el doctor McGraw, dise- 
ñador de la prueba, cree que se relaciona estrechamente con la habilidad para crear videojuegos. 
Para la población en general, la media de esta prueba es de 100. En seguida aparecen los resul- 
tados de la prueba en el caso de los aspirantes. 


95 

105 

120 

81 

90 

115 

99 

100 

130 

10 


El presidente se encuentra interesado en las cualidades generales de los aspirantes al puesto 
basadas en la prueba. Calcule los resultados medio y mediano de los diez aspirantes. ¿Qué infor- 
maría usted al presidente? ¿Le parece que los aspirantes son mejores que el resto de la pobla- 
ción? 


3.9 Posiciones relativas de la media, la mediana y la moda 
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3.8 Solución con software 

Con un paquete de software de estadística determine varias medidas de ubicación. 


r 

€jemplo 


Solución 


La tabla 2-4 de la página 30 muestra la ganancia que obtuvo Applewood Auto Group el mes 
pasado por la venta de 180 vehículos. Determine los precios de venta medio y mediano. 

Los montos medio, mediano y modal de las ganancias se presentan en el informe de la siguien- 
te captura de pantalla de Excel (los cuales aparecen resaltados). (Recuerde que las instruccio- 
nes para crear la salida aparecen en la sección de Comandos de software localizada al final 
del capítulo.) En el estudio se incluyen 180 vehículos, así que los cálculos con una calculadora 
resultarían tediosos y propensos a error. 
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78 
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10 

28 

52.692 
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0 
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-0.24 

11 

29 
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0 
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12 

29 
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Sedan 

2 
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294 

13 

>0 
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) 

Máximum 

3292 

14 

» 

5754 

Olean 

Sedan 

2 

Sum 

«17/0 

15 

30 

51.621 

sttetfieid 

Truc* 

1 

Count 

180 


La ganancia promedio es de $1 843.1 7 y la mediana de $1 882.50. La diferencia entre estos 
valores es menor a $40, así que cualquiera de estos dos valores es razonable. También es posi- 
ble ver en la captura de pantalla de Excel que se vendieron 180 vehículos, y que la ganancia 
total fue de $331 700.00. Más adelante se explicará el significado de error estándar, desviación 
estándar y otras medidas reportadas en esta salida, en éste y en otros capítulos. 

¿Qué podemos concluir? La ganancia típica de un vehículo es de aproximadamente 
$1 850. La gerencia de Applewood puede usar este valor para realizar la proyección de sus 
ingresos. Por ejemplo, si la distribuidora puede incrementar el número de ventas en un mes, de 
1 80 a 200, puede obtener una estimación adicional de $37 000 de ganancia, calculada median- 
te 20($1 850). 


En una distribución en forma 
de campana la media, la 
mediana y la moda son igua- 
les. 


3.9 Posiciones relativas de la media, 
la mediana y la moda 

Observe el histograma de la gráfica 3-2. Se trata de una distribución simétrica que también 
tiene forma de campana. Esta distribución posee la misma forma a cualquier lado del centro. 
Si el polígono estuviera doblado a la mitad, las dos mitades serían idénticas. En cualquier dis- 
tribución simétrica, la moda, la mediana y la media siempre son iguales. Son equivalentes a 20 
años en la gráfica 3-2. Hay distribuciones simétricas que no tienen forma de campana. 
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Una distribución sesgada no 
es simétrica. 


Simétrica 



Mediana = 20 
Moda = 20 


GRÁFICA 3-2 Distribución simétrica 


El número de años correspondiente al punto más alto de la curva es la moda (20 años). 
Como la distribución es simétrica, la mediana corresponde al punto en el que la distribución 
se divide a la mitad (20 años). El número total de frecuencias que representan muchos años 
se encuentra compensado por el número total que representa pocos años, lo cual da como 
resultado una media aritmética de 20 años. Cualquiera de estas tres medidas sería adecuada 
para representar el centro de la distribución. 

Si una distribución no es simétrica, o sesgada, la relación entre las tres medidas cambia. 
En una distribución con sesgo positivo la media aritmética es la mayor de las tres medidas. 
¿Por qué? Porque en ella influyen, más que sobre la mediana o la moda, unos cuantos valo- 
res extremadamente altos. Por lo general, la mediana es la siguiente medida más grande en 
una distribución de frecuencias con sesgo positivo. La moda es la menor de las tres medidas. 

Si la distribución tiene un sesgo muy pronunciado, como en el caso de los ingresos sema- 
nales de la gráfica 3-3, la media no sería una medida adecuada. La mediana y la moda serían 
más representativas. 



Moda Mediana Media 
$300 $500 $700 


GRÁFICA 3-3 Distribución con sesgo positivo 


Por el contrario, si una distribución tiene un sesgo negativo, la media es la menor medi- 
da de las tres. Por supuesto, la media es sensible a la influencia de una cantidad extremada- 
mente pequeña de observaciones. La mediana es mayor que la media aritmética y la moda es 
la más grande de las tres medidas. De nuevo, si la distribución tiene un sesgo muy pronuncia- 
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do, como la distribución de fuerzas de tensión que se muestran en la gráfica 3-4, la media no 
se utilizaría para representar a los datos. 



Media Mediana Moda 
2 600 2 800 3 000 


GRÁFICA 3-4 Distribución con sesgo negativo 



Las ventas semanales de una muestra de tiendas de suministros electrónicos de alta tecnología se 
organizaron en una distribución de frecuencias. La media de las ventas semanales que se calculó 
fue de $105 900, la mediana de $105 000 y la moda de $104 500. 

a) Trace una gráfica de las ventas con forma de polígono de frecuencias suavizado. Observe la ubi- 
cación de la media, la mediana y la moda sobre el eje x. 

b) ¿La distribución es simétrica, tiene un sesgo positivo o un sesgo negativo? Explique su res- 
puesta. 


comect 


Ejercicios 

25. La tasa de desempleo en el estado de Alaska durante los 1 2 meses de 2004 aparece en la siguien- 
te tabla: 


Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Dic 

8. 7 

8.8 

8.7 

7.8 

7.3 

7.8 

6.6 

6.5 

6.5 

6.8 

7.3 

7.6 


a) ¿Cuál es la media aritmética de la tasa de desempleo en Alaska? 

b) Encuentre la media y la moda de la tasa de desempleo. 

c) Calcule la media aritmética y la mediana sólo de los meses de invierno (de diciembre a marzo). 
¿Es muy diferente? 

26. Big Orange Trucking diseña un sistema de información que se utiliza para comunicaciones en cabi- 
na. Debe resumir datos de ocho sitios de cierta zona para describir condiciones típicas. Calcule 
una medida adecuada de ubicación central de cada una de las tres variables que aparecen en la 
siguiente tabla: 


Ciudad 

Dirección del viento 

Temperatura 

Pavimento 

Anniston, AL 

Oeste 

89 

Seco 

Atlanta, GA 

Noroeste 

86 

Mojado 

Augusta, GA 

Suroeste 

92 

Mojado 

Birmingham, AL 

Sur 

91 

Seco 

Jackson, MS 

Suroeste 

92 

Seco 

Meridian, MS 

Sur 

92 

Sendero 

Monroe, LA 

Suroeste 

93 

Mojado 

Tuscaloosa, AL 

Suroeste 

93 

Sendero 
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3.10 Media geométrica 

OA6 Calcular la media La media geométrica resulta útil para determinar el cambio promedio de porcentajes, razones, 

geométrica. índices o tasas de crecimiento. Posee amplias aplicaciones en la administración y la econo- 

mía, ya que con frecuencia hay interés en determinar los cambios porcentuales de ventas, 
salarios o cifras económicas, como el producto interno bruto, los cuales se combinan o se 
basan unos en otros. La media geométrica de un conjunto de n números positivos se define 
como la raíz enésima de un producto de n variables. La fórmula de la media geométrica se 
escribe de la siguiente manera: 


MEDIA GEOMETRICA 


MG = V(X,)(X 2 ) ■ ■ ■ (X n ) 


(3 


-4) 


La media geométrica nunca 
es mayor que la media arit- 
mética. 


La media geométrica siempre es menor o igual (nunca mayor que) que la media aritmética. 
Todos los datos deben ser positivos. 

Como ejemplo de media geométrica, suponga que usted recibe 5% de incremento sala- 
rial este año y 15% de incremento el siguiente. El incremento porcentual anual promedio es de 
9.886, no de 10.0. ¿Por qué razón? Comience calculando la media geométrica. Recuerde, por 
ejemplo, que 5% de incremento salarial equivale a 105%, que se expresa como 1.05. 

MG = V(1.05)(1.15) = 1.09886 

Este resultado puede verificarse suponiendo que su ingreso mensual fue de $3 000 para 
comenzar y que recibió dos incrementos de 5 y 15%. 

Incremento 1 = $3 000 (.05) = $150.00 
Incremento 2 = $3 1 50 (.1 5) = 472.50 
Total $622.50 

El incremento total de su salario es de $622.50. Esto equivale a: 

$3 000.00 (.09886) = $296.58 

$3 296.58 (.09886) = 325.90 

$622.48 que es alrededor de $622.50 

El siguiente ejemplo muestra la media geométrica de diversos porcentajes. 


Cjemplo 

Solución 


La recuperación de una inversión que realizó Atkins Construction Company durante cuatro 
años consecutivos fue de 30%, 20%, -40% y 200%. ¿Cuál es la media geométrica de la recu- 
peración de la inversión? 

El número 1 .3 representa 30% de la recuperación de la inversión, que es la inversión original de 
1.0 más la recuperación de 0.3. El número 0.6 representa la pérdida de 40%, que es la inver- 
sión original de 1 .0 menos la pérdida de 0.4. Este cálculo supone que el total de la inversión de 
cada periodo se reinvierte o se convierte en la base de la siguiente. En otras palabras, la base 
del segundo periodo es 1 .3 y la base del tercer periodo es (1 .3)(1 .2) y así sucesivamente. 

En consecuencia, la media geométrica de la tasa de recuperación es de 29.4%, que se 
determina por medio del siguiente cálculo: 

MG =A7(X 1 )(X 2 ) • ■ ■ (X n ) = X^(1 .3)(1 .2)(0.6)(3.0) = ^2.808 = 1.294 

De esta manera, la media geométrica es la raíz cuarta de 2.808. Así, la tasa promedio de recu- 
peración (tasa de crecimiento anual compuesta) es de 29.4%. 

Observe, asimismo, que si calcula la media aritmética [(30 + 20 - 40 + 200)/4 = 52.5], 
obtendrá un número mucho más grande, lo que dispararía la tasa de recuperación real. 
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Otro modelo de aplicación de la media geométrica se relaciona con la determinación de 
un cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted ganó $30 000 en 
2000 y $50 000 en 2010, ¿cuál es la tasa anual de incremento durante el periodo? Ésta es de 
5.24%. La tasa de incremento se determina a partir de la siguiente fórmula. 


TASA DE INCREMENTO J Valor al final del periodo 

Mü ~ V Valor al Inicio del periodo 


En el recuadro anterior, n es el número de periodos. Un ejemplo mostrará los detalles para 
determinar el Incremento porcentual anual. 


Cjemplo 


Solución 



Durante la decada de los noventa y hasta los primeros anos de 2000, Las Vegas, Nevada, fue 
la ciudad de mayor crecimiento en Estados Unidos. La población se incrementó de 258 295 en 
1990 a 607 876 en 2009. Es un incremento de 349 581 personas o 135.3% durante el periodo. 
¿Cuál es el incremento anua I promedio? 


Hay 19 años entre 1990 y 2009, así que n = 19. De esta manera, la fórmula (3-5) de la media 
geométrica, aplicada a este problema, se transforma en: 


MG = 


Valor al final de periodo 
Valor al Inicio del periodo 


- 1.0 = 


607 876 
258 295 


-1.0 =1.0461 -1.0 = 0.0461 


El valor de 0.0461 indica que el crecimiento anual promedio durante el periodo fue de 
4.61%. Expresado en otros términos, la población de Las Vegas creció a una tasa de 4.61% 
por año de 1990 a 2009. 


comed: 


Ejercicios 

27. Calcule la media geométrica de los siguientes incrementos porcentuales: 8, 12, 14, 26 y 5. 

28. Estime la media geométrica de los siguientes incrementos porcentuales: 2, 8, 6, 4, 10, 6, 8 y 4. 

29. A continuación se enlista el incremento porcentual de ventas de MG Corporation durante los pasa- 
dos 5 años. Determine la media geométrica del incremento porcentual de ventas en ese periodo. 


9.4 13.8 11.7 11.9 14.7 
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30. En 1996, en Estados Unidos, un total de 14 968 000 contribuyentes presentaron en forma elec- 
trónica sus declaraciones de impuestos. En el año 2009 el número se había incrementado a 
95 000 000. ¿Cuál es la media geométrica del incremento anual del periodo? 

31. El U.S. Bureau of Labor Statistics publica mensualmente el índice de precios al consumidor. 
Informa el cambio de precios de una canasta de artículos en el mercado de un periodo a otro. El 
índice de 2000 fue de 172.2. En 2009 se incrementó a 214.5. ¿Cuál es la media geométrica del 
incremento anual de dicho periodo? 

32. JetBIue Airways es una aerolínea estadounidense de bajo costo con sede en la ciudad de Nueva 
York. Su base principal está en el Aeropuerto Internacional John F. Kennedy. La ganancia de 
JetBIue en 2002 fue de 635.2 millones de dólares. En 2009 se incrementó a 3 290.0 millones. ¿Cuál 
es la media geométrica del incremento anual en dicho periodo? 

33. En 1985 había 340 213 suscriptores a la telefonía celular en Estados Unidos. En 2008, el número 
de suscriptores aumentó a 262 700 000. ¿Cuál es la media geométrica del incremento anual en 
dicho periodo? 

34. La información que sigue muestra el costo de un año de estudios en universidades públicas y pri- 
vadas en 1980-1981 y 2007-2008. ¿Cuál es la media geométrica del incremento anual en dicho 
periodo en el caso de los dos tipos de escuelas? Compare las tasas de incremento. 


Tipo de universidad 

1980-1981 

2007-2008 

Pública 

$2 550 

$ 6 966 

Privada 

5 594 

13 424 


r 


Estadística en acción 

El servicio postal de 
Estados Unidos ha inten- 
tado comportarse de 
forma más amigable con 
el usuario en los últimos 
siete años. Una encuesta 
reciente mostró que los 
consumidores estaban 
interesados en que 
hubiera más regularidad 
en los tiempos de entre- 
ga. Antes, una carta local 
podría tardar en llegar 
un día o varios. “Sólo 
díganme con cuántos 
días de anticipación 
tengo que enviar una tar- 
jeta de felicitación a 
mamá para que llegue el 
día de su cumpleaños, ni 
antes ni después”, era 
una queja común. El 
nivel de regularidad se 
mide a partir de la des- 
viación estándar de los 
tiempos de entrega. 




3.11 / Por qué estudiar la dispersión? 

Una medida de ubicación, como la media o la mediana, sólo describe el centro de los datos. 
Desde este punto de vista resulta valiosa, pero no dice nada sobre la dispersión de los da- 
tos. Por ejemplo, si la guía de turismo ecológico dice que el río que se encuentra a pocos 
pasos tiene en promedio 3 pies de profundidad, ¿querría usted cruzarlo a pie sin más informa- 
ción? Quizá no. Usted desearía saber algo sobre la variación de la profundidad. ¿Mide 3.25 
pies la máxima profundidad y 2.75 pies la mínima? En dicho caso, usted estaría de acuerdo 
en cruzar. ¿Qué hay si usted se enteró de que la profundidad del río variaba de 0.50 a 5.5 pies? 
Su decisión probablemente sería no cruzar. Antes de tomar una decisión, usted desea infor- 
mación tanto de la profundidad típica como de la dispersión de la profundidad del río. 

Una medida de dispersión pequeña indica que los datos se acumulan con proximidad 
alrededor de la media aritmética. Por consiguiente, la media se considera representativa de los 
datos. Por el contrario, una medida grande de dispersión indica que la media no es confiable 
(vea la gráfica 3-5). Los 100 empleados de Hammond Iron Works, Inc., una compañía que 
fabrica acero, se organizan en un histograma basado en el número de años que los emplea- 
dos han laborado en la compañía. La media es de 4.9 años, pero la dispersión de los datos es 
de 6 meses a 1 6.8 años. La media de 4.9 años no es muy representativa de todos los emplea- 
dos. 

Una segunda razón para estudiar la dispersión en un conjunto de datos consiste en com- 
parar la propagación en dos o más distribuciones. Por ejemplo, suponga que el nuevo moni- 
tor de computadora Vision Quest LCD se arma en Baton Rouge y también en Tucson. La pro- 
ducción media aritmética por hora, tanto en la planta de Baton Rouge como en la de Tucson, 
es de 50. Sobre la base de las dos medias, podría concluir que las distribuciones de las pro- 
ducciones por hora son idénticas. Sin embargo, los registros de producción de 9 horas en las 
dos plantas revelan que esta conclusión no es correcta (vea la gráfica 3-6). La producción de 
Baton Rouge varía de 48 a 52 montajes por hora. La producción en la planta de Tucson es más 
errática, ya que varía de 40 a 60 la hora. Por lo tanto, la producción por hora en Baton Rouge 
se acumula cerca de la media de 50; la producción por hora de Tucson es más dispersa. 
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Años 


GRÁFICA 3-5 Histog rama de los años laborados para Hammond Iron Works, Inc. 
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Baton Rouge O O O 
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GRAFICA 3-6 Producción por hora de monitores de computadora en las plantas de Baton 
Rouge y Tucson 


3.12 Medidas de dispersión 

0A7 Explicar y aplicar Consideraremos diversas medidas de dispersión. El rango se sustenta en los valores máximo 

medidas de dispersión. y mínimo del conjunto de datos, es decir, sólo se consideran dos valores. La desviación media, 

la varianza y la desviación estándar se basan en desviaciones de la media aritmética. 


Rango 

La medida más simple de dispersión es el rango. Representa la diferencia entre los valores 
máximo y mínimo de un conjunto de datos. En forma de ecuación: 



CAPÍTULO 3 Descripción de datos: medidas numéricas 


Cjemplo 

Solución 




RANGO 


Rango = Valor máximo - valor mínimo 


(3-6) 


El rango se emplea mucho en aplicaciones de control de procesos estadísticos (CPE), debido 
a que resulta fácil de calcular y entender. 


Consulte la gráfica 3-6. Determine el rango del número de monitores de computadora que se 
producen por hora en las plantas de Baton Rouge y Tucson. Interprete los dos rangos. 


El rango de la producción por hora de monitores de computadora en la planta de Baton Rouge 
es de 4, el cual se determina por la diferencia entre la producción máxima por hora de 52 y la 
mínima de 48. El rango de la producción por hora en la planta de Tucson es de 20 monitores, 
que se obtiene con el cálculo 60 - 40. Por lo tanto: 1) existe menos dispersión en la produc- 
ción por hora en la planta de Baton Rouge que en la de Tucson, porque el rango de 4 monito- 
res es menor que el rango de 20 monitores; 2) la producción se acumula más alrededor de la 
media de 50 en la planta de Baton Rouge que en la planta de Tucson (ya que un rango de 4 es 
menor que un rango de 20). Por ello, la producción media en la planta de Baton Rouge (50 
monitores) resulta una medida de ubicación más representativa que la media de 50 monitores 
en la planta de Tucson. 


Desviación media 

Un problema que presenta el rango estriba en que parte de dos valores, el más alto y el más 
bajo, es decir, no los toma en cuenta a todos. La desviación media sí lo hace; mide la canti- 
dad media respecto de la cual los valores de una población o muestra varían. Expresado en 
forma de definición: 


DESVIACIÓN MEDIA Media aritmética de los valores absolutos de las desviaciones con respec- 
to a la media aritmética. 

V / 


En el caso de una muestra, la desviación media, designada DM, se calcula mediante la 
fórmula: 


r 


DESVIACION MEDIA 


v 


DM 


s|x -x| 

n 




(3-7) 




en donde: 

X es el valor de cada observación. 

X es la media aritmética de los valores. 
n es el número de observaciones en la muestra. 
I indica el valor absoluto. 


¿Por qué ignorar los signos de las desviaciones de la media? De no hacerlo, las desviaciones 
positivas y negativas se compensarían con exactitud unas a otras y la desviación media siem- 
pre sería cero. Dicha medida (cero) resultaría un estadístico sin utilidad. 
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La siguiente tabla muestra el número de capuchinos 
que se vendieron en el local de Starbucks de los aero- 
puertos de Orange County y de Ontario, California, 
entre las 4 y las 5 de la tarde, de una muestra de 5 días 
el mes pasado. 


Aeropuertos de California 


Ontario 

20 

20 

40 

49 

SO 

SO 

60 

SI 

80 

80 


Determine la media, la mediana, el rango y la desviación 
media de cada local. Compare las similitudes y diferen- 
cias. 


Solución 


La media, la mediana y el rango de cada aeropuerto se reportan a continuación como parte de 
una hoja de cálculo de Excel. 



Observe que las tres medidas son exactamente iguales. ¿Indica esto que no hay diferencias 
entre ambos grupos de datos? Calculando las desviaciones medias, se obtiene un panorama 
más claro. Primero, Orange County: 



A 

B 

C 

1 

Cálculo de la desviación media: Orange County 

2 

Vendidos 

Cada valor - Media 

Desviación absoluta 

3 

20 

20 -SO =30 

30 

4 

40 

40- 50 »-10 

10 

S 

<0 

SO-SOsO 

0 

6 

60 

60-60-10 

10 

7 

so 

80- 50 = 30 

30 

8 



9 


Total 

SO 


DM 


s|x -x 

n 


30 + 10 + 0 + 10 + 30 _ 80 
5 5 


16 
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La desviación media es de 16 capuchinos al día: el número de capuchinos vendidos se 
desvía, en promedio, 16 unidades de la media de 50 capuchinos al día. 

La siguiente tabla muestra los detalles para determinar la desviación media para el núme- 
ro de capuchinos vendidos en el Aeropuerto de Ontario. 



A 

a 

C 

1 

2 

Cálculo de la desviación media: Orange County 
Vendidos Cada valor - Media Desviación absoluta 

3 

» 

20-SO* 30 

30 

4 

49 

49-50*-! 

1 

5 

$0 

SO-SO 0 

0 

6 

SI 

S1-S0*1 

1 

7 

90 

90 - 50 = 30 

30 

> 


9 

Total 

67 


DM 


J.\X-X 

n 


30 + 1 + 0 + 1 + 30 62 

5 “ 5 


12.4 


Las tablas indican que la media, la mediana y el rango de los capuchinos que se vendie- 
ron en ambos aeropuertos son los mismos, pero las desviaciones medias son distintas. La des- 
viación media de Orange County es 16, pero en Ontario es 12.4. 

Interprete y compare los resultados de las medidas en el caso de las tiendas de Starbucks. 
La media y la mediana de las dos tiendas son exactamente las mismas, 50 capuchinos al día. 
Por consiguiente, la ubicación de ambas distribuciones es la misma. El rango en ambas tien- 
das también es igual, 60. Sin embargo, recuerde que el rango proporciona información limita- 
da sobre la dispersión de la distribución, porque se basa sólo en dos observaciones. 

Las desviaciones medias no son las mismas en los dos aeropuertos, porque se basan en 
las diferencias entre todas las observaciones y la media aritmética, que muestra la relativa pro- 
ximidad o acumulación de los datos concernientes a la media o centro de la distribución. 
Compare la desviación media de Orange County de 16 con la desviación de Ontario de 12.4. 
Sobre la base de la desviación media, es posible decir que la dispersión de la distribución de 
ventas de Starbucks Ontario se encuentra más concentrada, cerca de la media de 50, que en 
la tienda de Orange County. 

Ventajas de la desviación La desviación media posee dos ventajas. Primero, incluye todos los valores de los cálcu- 

media. los. Recuerde que el rango sólo incluye los valores máximo y mínimo. Segundo, es fácil de defi- 

nir: es la cantidad promedio que los valores se desvían de la media. Sin embargo, su inconve- 
niente es el empleo de valores absolutos. Por lo general, es difícil trabajar con valores absolu- 
tos, así que la desviación media no se emplea con tanta frecuencia como otras medidas de dis- 
persión, como la desviación estándar. 





Los pesos de los contenedores enviados a Irlanda son (en miles de libras): 


95 103 105 110 104 105 112 90 


a) ¿Cuál es el rango de los pesos? 

b) Calcule el peso medio aritmético. 

c) Estime la desviación media de los pesos. 
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comect 


OA8 Calcular e interpretar 
la varianza y la desviación 
estándar. 


Ejercicios 

En los ejercicios 35-38, calcule: a) el rango; b) la media aritmética; c) la desviación media; d) interprete 

los valores que obtenga. 

35. Hubo cinco representantes de servicio al cliente que trabajaron en Electronic Super Store durante 
la pasada venta de fin de semana. Las cantidades de HDTV que vendieron estos representantes 
son: 5, 8, 4, 10 y 3. 

36. El Departamento de Estadística de la Western State University ofrece ocho secciones de estadís- 
tica básica. En seguida aparecen los números de estudiantes matriculados en estas secciones: 34, 
46, 52, 29, 41, 38, 36 y 28. 

37. Dave’s Automatic Door instala puertas automáticas para cocheras. La siguiente lista indica el 

número de minutos que se requieren para instalar una muestra de 10 puertas automáticas: 28, 32, 
24, 46, 44, 40, 54, 38, 32 y 42. ^ 

38. Una muestra de ocho compañías de la industria aeronáutica participaron en una encuesta sobre 
la recuperación de la inversión que tuvieron el año pasado. Los resultados (en porcentaje) son los 
siguientes: 10.6, 12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y 15.6. 

39. Diez adultos jóvenes que viven en California, elegidos al azar, calificaron el sabor de una nueva 
pizza de sushi con atún, arroz y kelp en una escala de 1 a 50, en la que el 1 indica que no les gusta 
el sabor y 50 que sí les gusta. Las calificaciones fueron las siguientes: m 


34 

39 

40 

46 

33 

31 

34 

14 

15 

45 


En un estudio paralelo, 10 adultos jóvenes de lowa, elegidos al azar, calificaron el sabor de la 
misma pizza. Las calificaciones fueron las siguientes: 


28 

25 

35 

16 

25 

29 

24 

26 

17 

20 


Como investigador de mercado, compare los mercados potenciales para la pizza de sushi. 

40. Una muestra de archivos de personal de ocho empleados en las instalaciones de Pawnee de Acmé 
Carpet Cleaners, Inc., reveló que durante el último semestre éstos perdieron la siguiente cantidad 
de días por enfermedad: 


2 

0 

6 

3 

10 

4 

1 

2 


Durante el mismo periodo, una muestra de ocho empleados que trabajaron en la planta de 
Chickpee de Acmé Carpets reveló que ellos perdieron las siguientes cantidades de días por enfer- 
medad: 


2 

0 

1 

0 

5 

0 

1 

0 


Como director de relaciones humanas, compare las ausencias en las dos plantas. ¿Qué recomen- 
daría? 


Varianza y desviación estándar 

La varianza y la desviación estándar también se fundamentan en las desviaciones de la 
media. Sin embargo, en lugar de trabajar con el valor absoluto de las desviaciones, la varian- 
za y la desviación estándar lo hacen con el cuadrado de las desviaciones. 


0 


3 


VARIANZA Media aritmética de las desviaciones de la media elevadas al cuadrado. 
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La varianza es no negativa y es cero sólo si todas las observaciones son las mismas. 


0 


DESVIACIÓN ESTÁNDAR Raíz cuadrada de la varianza. 


J 


La varianza y la desviación 
estándar se basan en las des- 
viaciones de la media eleva- 
das al cuadrado. 


Varianza de la población Las fórmulas de la varianza poblacional y la varianza de la 
muestra son ligeramente diferentes. La varianza de la población se estudia primero. (Recuerde 
que una población es la totalidad de las observaciones estudiadas.) La varianza de la pobla- 
ción se determina de la siguiente manera: 


/ 

VARIANZA DE LA POBLACIÓN 

V 


W ~ 

N 


\ 

(3-8) 

J 


En esta fórmula: 

ct 2 es la varianza de la población (a es la letra minúscula griega sigma); se lee sigma al 
cuadrado. 

X es el valor de una observación de la población. 

|jl es la media aritmética de la población. 

N es el número de observaciones de la población. 

Observe el proceso de cálculo de la varianza: 

1 . Comience por determinar la media. 

2. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado dicha diferen- 
cia. 

3. Sume todas las diferencias elevadas al cuadrado. 

4. Divida la suma de las diferencias elevadas al cuadrado entre el número de elementos de 
la población. 

Así, usted podría pensar que la varianza de la población es la media de las diferencias eleva- 
das al cuadrado entre cada valor y la media. En las poblaciones cuyos valores son cercanos 
a la media, la varianza de la población puede ser pequeña. En las poblaciones cuyos valores 
se apartan de la media, la varianza de la población puede ser grande. 

La varianza compensa el inconveniente que presenta el rango al utilizar todos los valores 
de la población, mientras que el rango incluye sólo los valores máximo y mínimo. El problema 
de que 2(X — pe) = 0, se corrige elevando al cuadrado las diferencias, en lugar de emplear 
valores absolutos. Elevar al cuadrado las diferencias siempre dará como resultado valores no 
negativos. 
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Mes 

Multas 

W 

X- fJL 

(X-pr) 2 

Enero 

19 

-10 

100 

Febrero 

17 

-12 

144 

Marzo 

22 

-7 

49 

Abril 

18 

-11 

121 

Mayo 

28 

-1 

1 

Junio 

34 

5 

25 

Julio 

45 

16 

256 

Agosto 

39 

10 

100 

Septiembre 

38 

9 

81 

Octubre 

44 

15 

225 

Noviembre 

34 

5 

25 

Diciembre 

10 

-19 

361 

Total 

348 

0 

1 488 


1. Para comenzar, es necesario determinar la media aritmética de la población. El número 
total de multas aplicadas en el año es de 348, así que la media aritmética por mes es 29. 

2X 19 + 17+ ■■■ + 10 348 „„ 


2. En seguida se calcula la diferencia entre la media y cada observación. Ésta se muestra en 
la tercera columna de la tabla. Recuerde que previamente en este capítulo (página 61), se 
indicó que la suma de las diferencias entre cada valor y la media es 0. En la hoja de cálcu- 
lo, la suma de las diferencias entre la media y el número de multas de cada mes es 0. 

3. El siguiente paso es elevar al cuadrado la diferencia entre cada valor mensual, operación 
que se muestra en la cuarta columna de la tabla. Al elevar las diferencias al cuadrado, con- 
vertimos tanto los valores positivos como negativos a un signo de más. Por lo tanto, cada 
diferencia será positiva. 

4. Se suman las diferencias elevadas al cuadrado. El total de la cuarta columna es 1 488. A 
esto se refiere la ecuación 2(X — |x) 2 . 

5. Finalmente, dividimos las diferencias elevadas al cuadrado por A/, el número de observa- 
ciones que se realizaron. 


S(X - n) 2 
N 


1 488 
12 


124 


Así, la variación de la población con respecto al número de multas es de 124. 

Como en el caso del rango y la desviación media, la varianza se emplea para comparar la 
dispersión entre dos o más conjuntos de observaciones. Por ejemplo, se calculó que la varian- 
za del número de multas levantadas en Beaufort County fue de 124. Si la varianza del número 
de multas aplicadas en Marlboro County, Carolina del Sur, es de 342.9, se concluye que: 1) hay 
menos dispersión en la distribución del número de multas levantadas en Beaufort (ya que 124 
es menor que 342.9); 2) el número de infracciones en Beaufort County se encuentra más api- 
ñado en torno a la media de 29 que el número de multas levantadas en Marlboro County. Por 
consiguiente, la media de multas aplicadas en Beaufort County constituye una medida de ubi- 
cación más representativa que la media de multas en Marlboro County. 
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La varianza resulta difícil de 
interpretar porque las unida- 
des se elevan al cuadrado. 


La desviación estándar se 
expresa en las mismas unida- 
des que los datos. 


Desviación estándar de la población Tanto el rango como la desviación media resul- 
tan fáciles de interpretar. El rango es la diferencia entre los valores alto y bajo de un conjunto 
de datos, y la desviación media es la media de las desviaciones de la media. Sin embargo, la 
varianza resulta difícil de interpretar en el caso de un solo conjunto de observaciones. La va- 
rianza de 124 del número de multas levantadas no se expresa en términos de multas, sino de 
multas elevadas al cuadrado. 

Existe una forma de salir del problema. Si extrae la raíz cuadrada de la varianza de la 
población, puede convertirla a las mismas unidades de medición que emplean los datos ori- 
ginales. La raíz cuadrada de 124 multas elevadas al cuadrado es de 11.4 multas. Las unida- 
des ahora son sencillamente multas. La raíz cuadrada de la varianza de la población es la des- 
viación estándar de la población. 


( 


\ 

DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN 

lw - t¿) 2 

CT V N 

(3-9) 

V 

J 


r 


Autoevaluación 


3-7 



Este año la oficina en Filadelfia de Price Waterhouse Coopers LLP contrató a cinco contadores que 
están haciendo prácticas. Los salarios mensuales iniciales de éstos fueron de $3 536, $3 173, 

$3 448, $3 121 y $3 622. 

a) Calcule la media de la población. 
tí) Estime la varianza de la población. 

c) Aproxime la desviación estándar de la población. 

d) La oficina de Pittsburgh contrató a cinco empleados que están haciendo prácticas. El salario 
mensual promedio fue de $3 550 y la desviación estándar de $250. Compare los dos grupos. 


comed 


Ejercicios 

41. Considere en una población los siguientes cinco valores: 8, 3, 7, 3 y 4. 
a) Determine la media de la población. 

ib) Determine la varianza. 

42. Considere a los siguientes seis valores como una población: 13, 3, 8, 10, 8 y 6. 
a) Determine la media de la población. 

ib) Determine la varianza. 

43. El informe anual de Dennis Industries incluyó las siguientes ganancias primarias por acción común 
durante los pasados 5 años: $2.68, $1 .03, $2.26, $4.30 y $3.58. Si supone que éstos son los valo- 
res poblacionales: 

a) ¿Cuáles son las medias aritméticas de las ganancias primarias por acción común? 

b) ¿Cuál es la varianza? 

44. Con respecto al ejercicio 43, el informe anual de Dennis Industries también arrojó estos rendimien- 
tos sobre valores de renta variable durante el mismo periodo de cinco años (en porcentaje): 13.2, 
5.0, 10.2, 17.5 y 12.9. 

a) ¿Cuál es la media aritmética del rendimiento? 

b) ¿Cuál es la varianza? 

45. Plywood, Inc., informó las siguientes utilidades sobre valores de renta variable durante los pasa- 
dos 5 años: 4.3, 4.9, 7.2, 6.7 y 11.6. Considere estos valores como poblacionales. 

a) Calcule el rango, la media aritmética, la varianza y la desviación estándar. 

¿>) Compare las utilidades sobre valores de renta variable de Playwood, Inc., con las de Dennis 
Industries que se citaron en el ejercicio 44. 

46. Los ingresos anuales de cinco vicepresidentes de TMV Industries son: $125 000, $128 000, 
$122 000, $133 000 y $140 000. Considere estos valores como una población. 

a) ¿Cuál es el rango? 

b) ¿Cuál es el ingreso medio aritmético? 

c) ¿Cuál es la varianza poblacional? ¿La desviación estándar? 

d) También se estudiaron los ingresos anuales del personal de otra empresa similar a TMV. La 
media fue de $129 000 y la desviación estándar de $8 612. Compare las medias y dispersio- 
nes de las dos firmas. 



3.12 Medidas de dispersión 
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Cjemplo 

Solución 


Varianza muestral La fórmula para determinar la media poblacional es |x = XX//V. 
Sencillamente, cambie los símbolos de la media de la muestra; es decir, X = XX/n. 
Desafortunadamente, la conversión de una varianza poblacional en una varianza muestral no 
es tan directa. Requiere un cambio en el denominador. En lugar de sustituir n (el número de 
la muestra) por N (el número de la población), el denominador es n — 1 . Así, la fórmula de la 
varianza muestral es: 


r 


VARIANZA MUESTRAL 


V 


X(X - X) 2 
' “ n - 1 


(3-10) 


donde: 

s 2 es la varianza muestral. 

X es el valor de cada observación de la muestra. 

X es la media de la muestra, 
n es el número de observaciones realizadas. 

¿Por qué se hizo este cambio en el denominador? Aunque el empleo de n se entiende en vir- 
tud de que se utiliza X para calcular p,, esto tiende a subestimar la varianza poblacional, <r 2 . 
La inclusión de (n — 1) en el denominador proporciona la corrección adecuada para esta ten- 
dencia. Como la aplicación fundamental de estadísticos muéstrales como s 2 es calcular pará- 
metros de población como ct 2 , se prefiere (n — 1) en lugar de n para definir la varianza mues- 
tral. También se emplea esta convención al calcular la desviación estándar de una muestra. 


Los salarios por hora de una muestra de empleados de medio tiempo de Home Depot son: $12, 
$20, $16, $18 y $19. ¿Cuál es la varianza de la muestra? 


La varianza muestral se calcula con la fórmula (3-10). 


- XX $85 
X " n ~ 5 " 


Salario por hora 
(X) 

X - X 

(X- X) 2 

$12 

— $5 

25 

20 

3 

9 

16 

-1 

1 

18 

1 

1 

19 

2 

4 

$85 

0 

40 


2 = X(X - X) 2 = 40 

n - 1 5-1 

= 10 en dólares al cuadrado 


Desviación estándar de la muestra La desviación estándar de la muestra se utiliza 
para estimar la desviación estándar de la población. Como se hizo notar, la desviación están- 
dar de la población es la raíz cuadrada de la varianza de la población. Asimismo, la desviación 
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estándar de la muestra es la raíz cuadrada de la varíanza de la muestra. La desviación están- 
dar de la muestra se calcula con mayor facilidad de la siguiente manera: 


DESVIACIÓN ESTÁNDAR DE LA MUESTRA 


s = 


2(X - X) 2 
n - 1 


( 3 - 11 ) 


y 


r 

Cjemplo 

La varianza de la muestra en el ejemplo anterior, que incluye salarios por hora, se calculó en 
10. ¿Cuál es la desviación estándar? 

Solución 

La desviación estándar de la muestra es $3.16, que se determina con VlO. Observe nueva- 
mente que la varianza de la muestra se expresa en términos de dólares al cuadrado, pero al 
extraer la raíz cuadrada a 10 se obtiene $3.16, que se encuentra en las mismas unidades (dóla- 

L. 

res) que los datos originales. 


3.13 Solución con software 

En la página 69 utilizamos Excel para determinar la media y la mediana de los datos de 
Applewood Auto Group. También notará que Excel presenta la desviación estándar de la 
muestra. Como la mayoría de los paquetes de software de estadística, Excel supone que los 
datos corresponden a una muestra. 

Otro paquete de software que se empleará en el libro es Minitab, que utiliza un formato de 
hoja de cálculo, muy parecido a Excel, aunque genera una variedad más amplia de datos 
de estadística. En seguida aparece la información de las ganancias por la venta de 180 ve- 
hículos el mes pasado en Applewood Auto Group. 



r 


Autoevaluación 


3-8 



Los años de servicio de una muestra de siete empleados en la oficina de quejas de State Farm 
Insurance, de Cleveland, Ohio, son: 4, 2, 5, 4, 5, 2 y 6. ¿Cuál es la varianza de la muestra? Calcule 
la desviación estándar de la muestra. 


Ejercicios 

En los ejercicios 47-52, efectúe lo siguiente: 

a) Calcule la varianza de la muestra. 

b) Determine la desviación estándar de la muestra. 

47. Considere los siguientes valores como una muestra: 7, 2, 6, 2 y 3. 

48. Los siguientes cinco valores son una muestra: 1 1 , 6, 1 0, 6 y 7. 
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Estadística en acción 

La mayoría de las univer- 
sidades informan el tama- 
ño promedio de los gru- 
pos. Esta información 
puede inducir a error, ya 
que el tamaño promedio 
se determina de diversas 
formas. Si calcula la can- 
tidad de estudiantes en 
cada clase en cierta uni- 
versidad, el resultado es 
la cantidad promedio de 
estudiantes por clase. Si 
recaba una lista de tama- 
ños de grupos y calcula el 
tamaño de grupo prome- 
dio, podría hallar que la 
media es muy diferente. 
Una escuela descubrió 
que el promedio de estu- 
diantes en cada una de 
sus 747 clases era de 40. 
Pero cuando calculó la 
media a partir de una 
lista de tamaños de 
grupo, ésta resultó ser de 
147. ¿Por qué la discre- 
pancia? Hay menos estu- 
diantes en los grupos 
pequeños y una gran can- 
tidad de estudiantes en 
los grupos grandes, lo 
cual tiene el efecto de 

( continúa ) 


OA9 Explicar el teorema de 
Chebyshev y la regla 
empírica. 


49. Dave’s Automatic Door, que se mencionó en el ejercicio 37, instala puertas automáticas para 
cocheras. Sobre la base de una muestra, los siguientes son los tiempos, en minutos, que se 
requieren para instalar 10 puertas automáticas: 28, 32, 24, 46, 44, 40, 54, 38, 32 y 42. 

50. A la muestra de ocho compañías en la industria aeronáutica (ejercicio 38), se le aplicó una encues- 
ta referente a su recuperación de inversión del año pasado. Los resultados son los siguientes: 1 0.6, 
12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y 15.6. g^ 

51. La Asociación de Propietarios de Moteles de Houston, Texas, llevó a cabo una encuesta relativa a 
las tarifas de motel entre semana en el área. En seguida aparece la tarifa por cuarto para huéspe- 
des de negocios en una muestra de 10 moteles. 


$101 $97 $103 $110 $78 $87 $101 $80 $106 $88 


52. Una organización de protección al consumidor se ocupa de las deudas de las tarjetas de crédito. 
Una encuesta entre 10 adultos jóvenes con una deuda con la tarjeta de crédito de más de $2 000 
mostró que éstos pagan en promedio un poco más de $100 mensuales como abono a sus saldos. 
En la siguiente lista aparecen las sumas que cada adulto joven pagó el mes pasado. 


$110 $126 $103 $93 $99 $113 $87 $101 $109 $100 


3.14 Interpretación y usos 
de la desviación estándar 

La desviación estándar normalmente se utiliza como medida para comparar la dispersión de 
dos o más conjuntos de observaciones. Por ejemplo, se calcula que la desviación estándar 
de las sumas quincenales invertidas en el plan de reparto de utilidades Dupree Saint Company 
es de $7.51. Suponga que estos empleados se ubican en Georgia. Si la desviación estándar 
de un grupo de empleados en Texas es de $10.47 y las medias son casi las mismas, esto Indi- 
ca que las sumas invertidas por los empleados de Georgia no se encuentran tan dispersas 
como las de los empleados en Texas (ya que $7.51 < $10.47). Como las sumas invertidas por 
los empleados de Georgia se acumulan más cerca de la media, su media es una medida más 
confiable que la media del grupo de Texas. 

Teorema de Chebyshev 

Ya se ha insistido en el hecho de que una desviación estándar pequeña de un conjunto de 
valores indica que éstos se localizan cerca de la media. Por lo contrario, una desviación gran- 
de revela que las observaciones se encuentran muy dispersas con respecto a la media. El 
matemático ruso P. L. Chebyshev (1821-1894) estableció un teorema que nos permite deter- 
minar la mínima porción de valores que se encuentran a cierta cantidad de desviaciones están- 
dares de la media. Por ejemplo, de acuerdo con el teorema de Chebyshev, por lo menos tres 
de cuatro valores, o 75%, deben encontrarse entre la media más dos desviaciones estánda- 
res y la media menos dos desviaciones estándares. Esta relación se cumple con independen- 
cia de la forma de la distribución. Además, por lo menos ocho de los nueve valores, 88.9%, 
se encontrarán más de tres desviaciones estándares y menos tres desviaciones estándares de 
la media. Por lo menos 24 de 25 valores, o 96%, se encontrará entre más y menos cinco des- 
viaciones estándares de la media. 

El teorema de Chebyshev establece lo siguiente: 


TEOREMA DE CHEBYSHEV En cualquier conjunto de observaciones (muestra o población), la 
proporción de valores que se encuentran a k desviaciones estándares de la media es de 
por lo menos 1 - 1//c 2 , siendo k cualquier constante mayor que 1. 
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La regla empírica 

La regla empírica sólo se apli- El teorema de Chebyshev se relaciona con cualquier conjunto de valores; es decir, que la dls- 
ca a distribuciones simétricas tribución de valores puede tener cierta forma. Sin embargo, en cualquier distribución simétri- 
con forma de campana. ca con forma de campana, como muestra la gráfica 3-7, es posible ser más precisos en la 

explicación de la dispersión en torno a la media. Estas relaciones que implican la desviación 
estándar y la media se encuentran descritas en la regla empírica, a veces denominada regla 
normal. 


( continuación de p. 85) 
incrementar el tamaño 
promedio de los grupos 
cuando se calcula de esta 
manera. Una universidad 
podría reducir su tamaño 
promedio de grupo si 
reduce el número de 
estudiantes en cada 
grupo. Esto significa eli- 
minar las cátedras en las 
que hay muchos estu- 
diantes de primer grado. 



REGLA EMPÍRICA En cualquier distribución de frecuencias simétrica con forma de campana, 
aproximadamente 68% de las observaciones se encontrarán entre más y menos una 
desviación estándar de la media; cerca de 95% de las observaciones se encontrarán entre 
más y menos dos desviaciones estándares de la media y, de hecho todas (99.7%), 
estarán entre más y menos tres desviaciones estándares de la media. 

V 


Estas relaciones se representan en la gráfica 3-7 en el caso de una distribución con forma de 
campana con una media de 100 y una desviación estándar de 10. 



GRAFICA 3-7 Curva simétrica con forma de campana que muestra las relaciones entre la 
desviación estándar y las observaciones 


Se ha observado que si una distribución es simétrica y tiene forma de campana, todas las 
observaciones se encuentran entre la media más y menos tres desviaciones estándares. Por 
consiguiente, siX = 100 ys = 10, todas las observaciones se encuentran entre 100 + 3(10) y 
100 — 3(10), o 70 y 130. Por lo tanto, el rango es de 60, que se calcula restando 130 — 70. 
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Por el contrario, si sabe que el rango es de 60, puede aproximar la desviación estándar 
dividiendo el rango entre 6. En este caso: rango -s- 6 = 60 -f- 6 = 10, la desviación estándar. 



comed 



Estadística en acción 

Joe Mauer, de los 
Gemelos de Minnesota, 
ostentó el máximo pro- 

( continúa ) 


Ejercicios 

53. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje de cualquier conjunto de 
observaciones se encontrará a 1 .8 desviaciones estándares de la media? 

54. El ingreso medio de un grupo de observaciones de una muestra es de $500; la desviación están- 
dar es de $40. De acuerdo con el teorema de Chebyshev, ¿por lo menos qué porcentaje de ingre- 
sos se encontrará entre $400 y $600? 

55. La distribución de pesos de una muestra de 1 400 contenedores de carga es simétrica y tiene 
forma de campana. De acuerdo con la regla empírica, ¿qué porcentaje de pesos se encontrará: 

a) entre X - 2s y X + 2s? 

b) ¿entre X y X + 2s? ¿Debajo de X - 2s? 

56. La siguiente gráfica representa la distribución del número de refrescos tamaño gigante que vendió 
el restaurante Wendy los recientes 141 días. La cantidad promedio de refrescos vendidos por día 
es de 91 .9 y la desviación estándar de 4.67. 





lili 


Ventas 


-f- 

100 




Si utiliza la regla empírica, ¿entre cuáles dos valores de 68% de los días se encontrarán las ventas? 
¿Entre cuáles dos valores de 95% de los días se encontrarán las ventas? 
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medio de bateo de 0.365 
durante la temporada 
2009 de la Liga Mayor de 
Béisbol. Tony Gwynn 
bateó 0.394 en la tempo- 
rada 1994, en la que 
hubo pocos strikes, y Ted 
Williams bateó 0.406 en 
1941. Nadie ha bateado 
arriba de 0.400 desde 
1941. El promedio de 
bateo se ha mantenido 
constante alrededor de 
0.260 por más de 100 
años, pero la desviación 
estándar se redujo de 
0.049 a 0.031. Esto indi- 
ca que hay menos disper- 
sión en el promedio de 
bateo de hoy y permite 
explicar la falta de batea- 
dores que hayan alcanza- 
do 0.400 recientemente. 



3.15 Media y desviación estándar 
de datos agrupados 

En la mayoría de los casos las medidas de ubicación, como la media, y las medidas de dis- 
persión, como la desviación estándar, se determinan utilizando valores individuales. Los 
paquetes de software de estadística facilitan el cálculo de estos valores, incluso en el caso de 
conjuntos grandes de datos. Sin embargo, algunas veces sólo se cuenta con la distribución 
de frecuencias y se desea calcular la media o la desviación estándar. En la siguiente explica- 
ción se le enseñará cómo calcular la media y la desviación estándar a partir de datos organi- 
zados en una distribución de frecuencias. Hay que insistir en que una media o una desviación 
estándar de datos agrupados es una estimación de los valores reales correspondientes. 


Media aritmética 

Para aproximar la media aritmética de datos organizados en una distribución de frecuencia, 
comience suponiendo que las observaciones en cada clase se representan a través del punto 
medio de la clase. La media de una muestra de datos organizados en una distribución de fre- 
cuencias se calcula de la siguiente manera: 


MEDIA ARITMÉTICA DE DATOS AGRUPADOS 


n 


(3-12) 


OA10 Calcular la media y la 
desviación estándar de datos 
agrupados. 


donde: 

X designa la media muestral. 

M es el punto medio de cada clase. 
f es la frecuencia en cada clase. 

fM es la frecuencia en cada clase multiplicada por el punto medio de la clase. 
Sf/W es la suma de estos productos, 
n es el número total de frecuencias. 


Cjemplo 


Los cálculos de la media aritmética de datos agrupados en una distribución de frecuencias que 
aparecen en seguida se basan en los datos de las ganancias de Applewood Auto Group. 
Recuerde que en el capítulo 2, tabla 2-7, en la página 33, construyó una distribución de fre- 
cuencias de precios de venta de vehículos. La información se repite abajo. Determine la ganan- 
cia media aritmética por vehículo. 
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Solución 




La ganancia media de los vehículos se calcula a partir de datos agrupados en una distribución 
de frecuencias. Para calcular la media, suponga que el punto medio de cada clase es represen- 
tativo de los valores de datos incluidos en dicha clase. Recuerde que el punto medio de una 
clase se encuentra a la mitad de los límites de clase superior e inferior. Para determinar el punto 
medio de una clase en particular, sume los límites de clase superior e inferior y divida entre 2. 
Por consiguiente, el punto medio de la primera clase es $400, que se calcula con la operación 
($200 + $600)/2. Suponga que el valor de $400 es representativo de los ocho valores incluidos 
en dicha clase. En otras palabras, se asume que la suma de los ocho valores en esta clase es 
de $3 200, que se calcula por medio del producto 8($400). Continúe con el proceso de multi- 
plicación del punto medio de clase por la frecuencia de clase de cada clase y en seguida sume 
estos productos. Los resultados se resumen en la tabla 3-1. 


TABLA 3-1 Ganancia sobre los 180 vehículos que se vendieron el mes pasado en Applewood 
Auto Group 


Ganancia 

Frecuencia (f) 

Punto medio ( M ) 

fM 

$ 200 a $ 600 

8 

$ 400 

$ 3 200 

600 a 1 000 

11 

800 

8 800 

1 000 a 1 400 

23 

1 200 

27 600 

1 400 a 1 800 

38 

1 600 

60 800 

1 800 a 2 200 

45 

2 000 

90 000 

2 200 a 2 600 

32 

2 400 

76 800 

2 600 a 3 000 

19 

2 800 

53 200 

3 000 a 3 400 

4 

3 200 

12 800 

Total 

180 


$333 200 


Al despejar la media aritmética de la fórmula (3-12) se obtiene: 

- _ _ $333 20Q _ 

n 180 

Así, se concluye que la ganancia media por vehículo es de aproximadamente $1 851 . 


Desviación estándar 

Para calcular la desviación estándar de datos agrupados en una distribución de frecuencias, 
necesita ajustar ligeramente la fórmula (3-11). Pondere cada una de las diferencias cuadradas 
por el número de frecuencias en cada clase. La fórmula es: 


DESVIACIÓN ESTÁNDAR, DATOS AGRUPADOS 


s = 


Ef(/W - X) 2 
n - 1 




(3-13) 


J 


donde: 

s es el símbolo de la desviación estándar de la muestra. 
M es el punto medio de la clase. 
f es la frecuencia de clase, 
n es el número de observaciones en la muestra. 

X designa la media muestral. 
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■ 


Consulte la distribución de frecuencias de los datos de la ganancia de Applewood Auto Group 
que aparecen en la tabla 3-1 . Calcule la desviación estándar de las ganancias que generó cada 
vehículo. 


De acuerdo con la misma técnica que se empleó para calcular la media de los datos agrupa- 
dos en una distribución de frecuencias, f es la frecuencia de clase, M es el punto medio de 
clase y n es el número de observaciones. 



Para determinar la desviación estándar: 


Paso 1: Reste la media del punto medio de clase. Es decir, encuentre ( M — X). Para la 
primera clase ($400 - $1 851 = -$1 451); para la segunda ($800 - $1 851 = 
-$1 051), y así en lo sucesivo. 

Paso 2: Eleve al cuadrado la diferencia entre el punto medio de clase y la media. En el 
caso de la primera clase sería ($400 - $1 851) 2 = 2 105 401; en el de la segun- 
da ($800 - $1 851) 2 = 1 104 601, y así en lo sucesivo. 

Paso 3: Multiplique la diferencia al cuadrado entre el punto medio de clase y la media por 
la frecuencia de clase. En el caso de la primera clase el valor es 8($400 - $1 851 ) 2 
= 16 843 208; en el de la segunda 1 1 ($800 - $1 851) 2 = 12 150 61 1 , y así suce- 
sivamente. 

Paso 4: Sume f(M — X) 2 . El total es 76 169 920. Para determinar la desviación estándar, 
inserte estos valores en la fórmula (3-13). 


s = 


2f(/W - X) 2 
n - 1 


76 1 69 780 

180 I 1 


= 652.33 


Por lo general, la media y la desviación estándar que se calculan a partir de datos agrupa- 
dos en una distribución de frecuencias se encuentran cerca de los valores calculados a partir 
de los datos en bruto. Los datos agrupados originan la pérdida de alguna información. En el 
ejemplo de la ganancia por vehículo, la ganancia media que aparece en la hoja de Excel de la 
página 69 es de $1 843.1 7, y la desviación estándar de $643.63. Los valores respectivos calcu- 
lados a partir de datos agrupados en una distribución de frecuencias son $1 851 .1 1 y $652.33. 
La diferencia entre las medias es de $7.94 o aproximadamente 0.4%. Las desviaciones están- 
dares difieren en $8.70 o 1.4%. Sobre la base de la diferencia porcentual, las aproximaciones 
se acercan mucho a los valores reales. 



Lo ingresos netos de una muestra de grandes importadores de antigüedades se organizaron en la 
siguiente tabla: 


Ingreso neto 
(millones de dólares) 

Número de 
importadores 

Ingreso neto 
(millones de dólares) 

Número de 
Importadores 

2a 6 

1 

14 a 18 

3 

6 a 10 

4 

18 a 22 

2 

10 a 14 

10 
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a) ¿Qué nombre recibe la tabla? 

b) Con base en la distribución, ¿cuál es el cálculo aproximado del ingreso neto medio aritmético? 

c) Con base en la distribución, ¿cuál es el cálculo aproximado de la desviación estándar? 


oomect 


Ejercicios 

57. Cuando calcula la media de una distribución de frecuencia, ¿por qué hace referencia a ésta como 
una media aproximada ? 

58. Determine la media y la desviación estándar de la siguiente distribución de frecuencias. 


Clase 

Frecuencia 

0 a 5 

2 

5 a 10 

7 

10 a 15 

12 

15 a 20 

6 

20 a 25 

3 


59. Determine la media y la desviación estándar de la siguiente distribución de frecuencias. 


Clase 

Frecuencia 

20 a 30 

7 

30 a 40 

12 

40 a 50 

21 

50 a 60 

18 

60 a 70 

12 


60. SCCoast, un proveedor de internet del sureste de Estados Unidos, elaboró una distribución de fre- 
cuencias sobre la edad de los usuarios de internet. Determine la media y la desviación estándar. 


Edad (años) 

Frecuencia 

10 a 20 

3 

20 a 30 

7 

30 a 40 

18 

40 a 50 

20 

50 a 60 

12 


61. El IRS (Internal Revenue Service) estaba interesado en el número de formas fiscales individuales 
que preparan las pequeñas empresas de contabilidad. El IRS tomó una muestra aleatoria de 50 
empresas de contabilidad pública con 10 o más empleados que operan en la zona de Dallas-Fort 
Worth. La siguiente tabla de frecuencias muestra los resultados del estudio. Calcule la media y la 
desviación estándar. 


Número 
de clientes 

Frecuencia 

20 a 30 

1 

30 a 40 

15 

40 a 50 

22 

50 a 60 

8 

60 a 70 

4 
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62. Los gastos en publicidad constituyen un elemento significativo del costo de los artículos vendidos. 
En seguida aparece una distribución de frecuencias que muestra ios gastos en publicidad de 60 
compañías manufactureras ubicadas en el suroeste de Estados Unidos. Calcule la media y la des- 
viación estándar de los gastos en publicidad. 


Gastos en publicidad 
($ millones) 

Número 
de compañías 

25 a 35 

5 

35 a 45 

10 

45 a 55 

21 

55 a 65 

16 

65 a 75 

8 

Total 

60 


3.16 Ética e informe de resultados 

En el capítulo 1 se analizó la manera de informar resultados estadísticos con ética e imparcia- 
lidad. Aunque está aprendiendo a organizar, resumir e interpretar datos mediante la estadísti- 
ca, también es importante que comprenda esta disciplina con el fin de que se convierta en un 
consumidor inteligente de información. 

En este capítulo aprendió la forma de calcular estadísticas descriptivas de naturaleza 
numérica. En particular, la manera de calcular e interpretar medidas de ubicación de un con- 
junto de datos: la media, la mediana y la moda. También ha estudiado las ventajas y desven- 
tajas de cada estadístico. Por ejemplo, si un agente de bienes raíces le dice a un cliente que 
la casa promedio de determinada parcela se vendió en $150 000, supondrá que $150 000 es 
un precio de venta representativo de todas las casas. Pero si el cliente pregunta, además, cuál 
es la mediana del precio de venta y resulta ser $60 000, ¿por qué el agente informó sólo el pre- 
cio promedio? Esta información es de suma importancia para que una persona tome una deci- 
sión cuando compra una casa. Conocer las ventajas y desventajas de la media, la mediana y 
la moda es importante al dar un informe estadístico y cuando se emplea información estadís- 
tica para tomar decisiones. 

También aprendió a calcular medidas de dispersión: el rango, la desviación media y la 
desviación estándar. Cada uno de estos estadísticos tiene ventajas y desventajas. Recuerde 
que el rango proporciona información sobre la dispersión total de una distribución. Sin embar- 
go, no aporta información sobre la forma en que se acumulan los datos o se concentran en 
torno al centro de la distribución. Conforme aprenda más estadística, necesitará recordar que 
cuando emplea esta disciplina debe mantener un punto de vista independiente y basado en 
principios. Cualquier informe estadístico requiere la comunicación honesta y objetiva de los 
resultados. 


Resumen del capítulo 

I. Una medida de ubicación es un valor que sirve para describir el centro de un conjunto de datos. 
A. La media aritmética es la medida de ubicación que más se informa. 

1. Se calcula mediante la suma de los valores de las observaciones, que luego se divide entre 
el número total de observaciones. 

a) La fórmula de una media poblacional de datos no agrupados o en bruto es: 

2X 


(3-1) 
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b) La fórmula de la media de una muestra es 

2X 


X = 


n 


c) La fórmula de la media muestral en una distribución de frecuencias es 


(3-2) 


(3-12) 


B. 


2. Las características principales de la media aritmética son las siguientes: 

a) Por lo menos se requiere la escala de medición de intervalo. 

b) Todos los valores de los datos se incluyen en el cálculo. 

c) Un conjunto de datos sólo posee una media. Es decir, que es única. 

d) La suma de las desviaciones de la media es igual a 0. 

La media ponderada se encuentra multiplicando cada observación por su correspondiente pon- 
deración. 

1. La fórmula para determinar la media ponderada es: 


— w¡X¡ + W2X2 + W3X3 + 

X w 


■ w n X n 


w-, + w 2 + w 3 + ■ ■ • + w„ 


(3-3) 


2. Ésta es un caso especial de la media aritmética. 

C. La mediana es el valor que se encuentra en medio de un conjunto de datos ordenados. 

1. Para determinar la mediana, se ordenan las observaciones de menor a mayor y se identifica 
el valor intermedio. 

2. Las principales características de la mediana son las siguientes: 

a) Se requiere por lo menos la escala ordinal de medición. 

b) No influyen sobre ésta valores extremos. 

c) Cincuenta por ciento de las observaciones son más grandes que la mediana. 

d) Ésta es única de un conjunto de datos. 

D. La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. 

1. La moda se determina en el caso de datos de nivel nominal. 

2. Un conjunto de datos puede tener más de una moda. 

E. La media geométrica es la enésima raíz del producto de n valores positivos. 

1. La fórmula de la media geométrica es la siguiente: 


MG =V(Xi)(X 2 )(X 3 ) ■ ■ ■ (X„) 


(3-4) 


2. La media geométrica también se emplea para determinar ia razón de cambio de un periodo 
a otro. 


MG = 


Valor al final del periodo 
Valor al inicio del periodo 


- 1 


(3-5) 


3. La media geométrica siempre es igual o menor que la media aritmética. 

II. La dispersión es la variación o propagación en un conjunto de datos. 

A. El rango es la diferencia entre el valor máximo y el mínimo en un conjunto de datos. 

1. La fórmula del rango es la siguiente: 

Rango = Valor más alto - valor más bajo (3-6) 


2. Las principales características del rango son: 

a) Sólo dos valores se emplean en su cálculo. 

b) Recibe la influencia de los valores extremos. 

c) Es fácil de calcular y definir. 

B. La desviación absoluta media es la suma de los valores absolutos de las desviaciones de la 
media, dividida entre el número de observaciones. 

1. La fórmula para calcular la desviación absoluta media es: 


DM 


2 |X — X| 
n 


(3-7) 


2. Las principales características de la desviación absoluta media son las siguientes: 

a) No influyen excesivamente sobre ella valores grandes o pequeños. 

b) Todas las observaciones se emplean para realizar el cálculo. 

c) Los valores absolutos son de alguna forma difíciles de manejar. 
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C. La varianza es la media de las desviaciones al cuadrado de la media aritmética. 
1. La fórmula de la varianza de la población es la siguiente: 

, 2(X - rí 2 

<T = 

N 


2. La fórmula de la varianza de la muestra es la siguiente: 

2 = 2(X - X) 2 

n - 1 


(3-8) 


(3-10) 


3. Las principales características de la varianza son: 

a) Todas las observaciones se utilizan para realizar el cálculo. 

b) No influyen excesivamente sobre ella observaciones extremas. 

c) Resulta de alguna manera difícil trabajar con las unidades, pues son las unidades origina- 
les elevadas al cuadrado. 

D. La desviación estándar es la raíz cuadrada de la varianza. 

1. Las principales características de la desviación estándar son: 

a) Se expresa en las mismas unidades de los datos originales. 

b) Es la raíz cuadrada de la distancia promedio al cuadrado de la media. 

c) No puede ser negativa. 

cf) Es la medida de dispersión que se informa con más frecuencia. 

2. La fórmula de la desviación estándar de la muestra es: 


s = 


2(X - X) 2 


1 


(3-11) 


3. La fórmula de la desviación estándar para datos agrupados es: 


s = 


2 f(M - X) 2 
n - 1 


(3-13) 


III. Se interpretó la desviación estándar empleando dos medidas. 

A. El teorema de Chebyshev establece que independientemente de la forma de la distribución, por 
lo menos 1 - 1 //c 2 de las observaciones se encontrarán a k desviaciones estándares de la media, 
siendo k mayor que 1 . 

B. La regla empírica afirma que en el caso de una distribución en forma de campana, alrededor de 
68% de los valores se encontrarán a una desviación estándar de la media; 95%, a dos y casi 
todas, a tres. 


Clave de pronunciación 


SIMBOLO 

SIGNIFICADO 

I a 

Media de población 

2 

Operación de suma 

2X 

Suma de un grupo de valores 

X 

Media de la muestra 

x w 

Media ponderada 

MG 

Media geométrica 

IfM 

Suma del producto de las frecuencias 
y los puntos medios de clase 

a 2 

Varianza de la población 

<T 

Desviación estándar de la población 


PRONUNCIACIÓN 

mu 
sigma 
sigma X 
X barra 

X barra subíndice w 
M G 

sigma f M 
sigma cuadrado 
sigma 


comed: 


Ejercicios del capítulo 

63. La empresa de contabilidad Crawford and Associates está formada por cinco socios. El día de 
ayer, éstos atendieron a seis, cuatro, siete y cinco clientes, respectivamente. 

a) Calcule el número medio y el número mediano de clientes que cada socio atendió. 

b) La media, ¿es muestral o poblacional? 

c) Verifique que 2(X - |x) = 0. 


Ejercicios del capítulo 
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64 . Owens Orchards vende manzanas por peso en bolsas grandes. Una muestra de siete bolsas con- 
tenía las siguientes cantidades de manzanas: 23, 19, 26, 17, 21, 24 y 22. 

a) Calcule la cantidad media y la cantidad mediana de manzanas que hay en una bolsa. 

b) Verifique que 2(X - X) = 0. 

65 . Una muestra de familias que ha contratado los servicios de la United Bell Phone Company reveló 
el siguiente número de llamadas que recibió cada familia la semana pasada. Determine el número 
medio y la mediana de llamadas que recibieron. ^ 


52 

43 

30 

38 

30 

42 

12 

46 

39 

37 

34 

46 

32 

18 

41 

5 






66. La Citizens Banking Company estudia la cantidad de veces que se utiliza al día el cajero automá- 
tico ubicado en uno de los supermercados de Loblaws, sobre Market Street. En seguida figuran 
las cantidades de ocasiones que se utilizó la máquina al día durante los pasados 30 días. 
Determine la cantidad media de veces que se utilizó la máquina al día. 


83 

64 

84 

76 

84 

54 

75 

59 

70 

61 

63 

80 

84 

73 

68 

52 

65 

90 

52 

77 

95 

36 

78 

61 

59 

84 

95 

47 

87 

60 


67 . Un estudio reciente sobre los hábitos de lavado de ropa de los estadounidenses incluyó el tiempo 
en minutos del ciclo de lavado. A continuación hay una muestra de 40 observaciones. Determine 
la media y la mediana de un ciclo de lavado típico. m 


35 

37 

28 

37 

33 

38 

37 

32 

28 

29 

39 

33 

32 

37 

33 

35 

36 

44 

36 

34 

40 

38 

46 

39 

37 

39 

34 

39 

31 

33 

37 

35 

39 

38 

37 

32 

43 

31 

31 

35 


68. Trudy Green trabaja en la True-Green Lawn Company. Su tarea consiste en ofrecer por teléfono 
mantenimiento de césped. En seguida aparece una lista de la cantidad de citas por hora que hizo 
durante las últimas 25 horas de llamadas. ¿Cuál es la media aritmética de citas que hace por hora? 
¿Cuál es la cantidad mediana de citas que hace por hora? Redacte un breve informe que resuma 
sus conclusiones. ^ 


9526564472363 

447844554833 


69 . La Split-A-Rail Fence Company vende tres tipos de cerca a propietarios de los suburbios de 
Seattle, Washington. El pie de instalación de las cercas grado A tienen un precio de $5.00. El de 
las cercas grado B, $6.50, y el de las de grado C, las de alta calidad, $8.00. Ayer, Split-A-Rail ins- 
taló 270 pies de cerca grado A, 300 pies de cerca grado B y 100 pies de cerca grado C. ¿Cuál fue 
el costo medio por pie de cerca instalada? 

70 . Rolland Poust es un estudiante de primer grado de la Facultad de Administración del Scandia 
Tech. El semestre anterior tomó dos cursos de estadística y contabilidad de 3 horas cada uno y 
obtuvo A en ambos. Obtuvo B en un curso de historia de cinco horas y B en un curso de historia 
del jazz de dos horas. Además, tomó un curso de una hora relativo a las reglas de basquetbol con 
el fin de obtener su licencia para arbitrar partidos de este deporte en escuelas secundarias. Obtuvo 
una A en este curso. ¿Cuál fue su promedio semestral? Suponga que le dan 4 puntos por una A; 
3 por una B y así sucesivamente. ¿Gué medida de ubicación calculó? 

71 . La siguiente tabla muestra el porcentaje de fuerza laboral desempleada y el tamaño de la fuerza 
laboral en tres condados del noroeste de Ohio. Jon Elsas es director regional de desarrollo econó- 
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mico. Debe presentar un informe a varias compañías que piensan ubicarse en el noroeste de Ohio. 
¿Cuál sería el índice de desempleo adecuado en toda la región? 


Condado 

Porcentaje de desempleo 

Tamaño de la fuerza laboral 

Wood 

4.5 

15 300 

Ottawa 

3.0 

10 400 

Lucas 

10.2 

150 600 


72. La Asociación Americana de Diabetes recomienda una lectura de valores de glucosa sanguínea 
menor a 130 para quienes tienen diabetes tipo 2. La glucosa sanguínea mide ia cantidad de azú- 
car en la sangre. A continuación se presentan las lecturas de febrero de una persona que fue 
recientemente diagnosticada con este tipo de diabetes. 


112 

122 

116 

103 

112 

96 

115 

98 

106 

111 

106 

124 

116 

127 

116 

108 

112 

112 
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109 
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a) ¿Cuál es la media aritmética de la lectura de glucosa sanguínea? 

b) ¿Cuál es la mediana de la lectura de glucosa sanguínea? 

c) ¿Cuál es la moda de la lectura de glucosa sanguínea? 

73. El área metropolitana de Los Angeles-Long Beach, California, es el área que se espera que mues- 
tre el mayor incremento del número de puestos de trabajo de 1 989 a 201 0. Se espera que el núme- 
ro de trabajos se incremente de 5 164 900 a 6 286 800. ¿Cuál es la media geométrica de la tasa 
de incremento anual esperada? 

74. Un artículo reciente sugirió que, si en la actualidad usted gana $25 000 anuales y la tasa de infla- 
ción se mantiene en 3% anual, usted necesitará ganar $33 598 en 10 años para tener el mismo 
poder adquisitivo. ¿Qué necesitaría hacer para percibir $44 771 si la tasa de inflación se elevara a 
6%? Confirme si estas afirmaciones son exactas determinando la tasa media geométrica de incre- 
mento. 

75. Las edades de una muestra que se tomó de turistas canadienses que vuelan de Toronto a Hong- 
Kong fueron las siguientes: 32, 21 , 60, 47, 54, 1 7, 72, 55, 33 y 41 . 

a) Calcule el rango. 

ib) Estime la desviación media. 

c) Calcule la desviación estándar. 

76. Los pesos (en libras) de una muestra de cinco cajas enviadas por UPS son: 12, 6, 7, 3 y 10. 

a) Calcule el rango. 

b) Aproxime la desviación media. 

c) Calcule la desviación estándar. 

77. La siguiente tabla presenta las inscripciones a 13 universidades públicas del estado de Ohio. 



Universidad 

Inscripciones 

University of Akron 

25 942 

Bowllng Green State University 

18 989 

Central State University 

1 820 

University of Cincinnati 

36 415 

Cleveland State University 

15 664 

Kent State University 

34 056 

Miami University 

17 161 

Ohio State University 

59 091 

Ohio University 

20 437 

Shawnee State University 

4 300 

University of Toledo 

20 775 

Wright State University 

18 786 

Youngstown State University 

14 682 


Ejercicios del capítulo 
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a) ¿Es una muestra o una población? 

£>) ¿Cuál es la media de las inscripciones? 

c) ¿Cuál es la mediana de las inscripciones? 

d) ¿Cuál es el rango de las inscripciones? 

e) Calcule la desviación estándar. 

78 . Los temas de salud representan una preocupación para gerentes, en especial cuando deben eva- 
luar el costo del seguro médico. Una encuesta reciente entre 150 ejecutivos de Elvers Industries, 
una importante empresa financiera y de seguros, ubicada en el suroeste de Estados Unidos, infor- 
mó la cantidad de libras de sobrepeso de los ejecutivos. Calcule la media y la desviación están- 
dar. 


Libras de sobrepeso 

Frecuencia 

Oa 6 

14 

6 a 12 

42 

12 a 18 

58 

18 a 24 

28 

24 a 30 

8 


79 . El programa espacial Apolo duró de 1967 hasta 1972 e incluyó 13 misiones. Las misiones tuvieron 
una duración de 7 a 301 horas. En seguida aparece la duración de cada vuelo. m 


9 

195 

241 

301 

216 

260 

7 

244 

192 

147 

10 

295 

142 









a) Explique por qué los tiempos de vuelo constituyen una población. 

b) Calcule la media y la mediana de los tiempos de vuelo. 

a) Estime el rango y la desviación estándar de los tiempos de vuelo. 

80 . Creek Ratz es un restaurante muy popular localizado en la costa del norte de Florida que sirve una 
variedad de alimentos con carne de res y mariscos. Durante la temporada de vacaciones de vera- 
no, no se aceptan reservaciones. La gerencia está interesada en conocer el tiempo que un cliente 
tiene que esperar antes de pasar a la mesa. A continuación aparece la lista de tiempos de espe- 
ra, en minutos, de las 25 mesas que se ocuparon la noche del sábado pasado. 


28 

39 

23 

67 

37 

28 

56 

40 

28 

50 

51 

45 

44 

65 

61 

27 

24 

61 

34 

44 

64 

25 

24 

27 

29 







a) Explique por qué los tiempos constituyen una población. 

£>) Calcule la media y la mediana de los tiempos de espera, 

c) Estime el rango y la desviación estándar de los tiempos de espera. 

81 . Una muestra de 25 estudiantes universitarios reportó las siguientes cifras en dólares de gastos por 
concepto de entretenimiento el año pasado. j 


684 

710 

688 

711 

722 

698 

723 

743 

738 

722 

696 

721 

685 

763 

681 

731 

736 

771 

693 

701 

737 

717 

752 

710 

697 



a) Encuentre la media, la mediana y la moda de esa información. 

b) ¿Cuáles son el rango y la desviación estándar? 

c) Emplee la regla empírica para establecer un intervalo que incluya aproximadamente 95% de las 
observaciones. 
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CAPÍTULO 3 Descripción de datos: medidas numéricas 


82. El Derby de Kentucky se celebra el primer sábado de mayo en Churchill Downs, en Louisville, 
Kentucky. La pista mide una milla y cuarto. La tabla muestra los ganadores desde 1990, su mar- 
gen de victoria, el tiempo ganador y la ganancia sobre una apuesta de 2 dólares. m 


Año 

Ganador 

Margen de ganancia 
(longitudes) 

Tiempo ganador 
(minutos) 

Ganancia sobre 
apuesta de 2 dls. 

1990 

Unbrldled 

3.5 

2.03333 

10.80 

1991 

Strlke the Gold 

1.75 

2.05000 

4.80 

1992 

Lil E. Tee 

1 

2.05000 

16.80 

1993 

Sea Hero 

2.5 

2.04000 

12.90 

1994 

Go For Gln 

2 

2.06000 

9.10 

1995 

Thunder Gulch 

2.25 

2.02000 

24.50 

1996 

Grlndstone 

nariz 

2.01667 

5.90 

1997 

Silver Charm 

cabeza 

2.04000 

4.00 

1998 

Real Quiet 

0.5 

2.03667 

8.40 

1999 

Charismatic 

cuello 

2.05333 

31 .30 

2000 

Fusaichi Pegasus 

1.5 

2.02000 

2.30 

2001 

Monarchos 

4.75 

1 .99950 

10.50 

2002 

War Emblem 

4 

2.01883 

20.50 

2003 

Funny Cide 

1.75 

2.01983 

12.80 

2004 

Smarty Jones 

2.75 

2.06767 

4.10 

2005 

Giacomo 

0.5 

2.04583 

50.30 

2006 

Barbara 

6.5 

2.02267 

6.10 

2007 

Street Sense 

2.25 

2.03617 

4.90 

2008 

Blg Brown 

4.75 

2.03033 

6.80 

2009 

Mine That Bird 

6.75 

2.04433 

103.20 

2010 

Super Saver 

2.50 

2.07417 

18.00 


a) Determine la media y la mediana de las variables de tiempo ganador y ganancia sobre apues- 
ta de 2 dólares. 

b) Determine el rango y la desviación estándar de las variables de tiempo ganador y ganancia. 

c) Refiérase a la variable de tiempo ganador. ¿Cuál es el nivel de medición? ¿Qué medida de ubi- 
cación sería la más adecuada? 

83. El gerente de la tienda Wal-Mart de la localidad estudia la cantidad de artículos que compran los 
consumidores en el horario de la tarde. A continuación aparece la cantidad de artículos de una 
muestra de 30 consumidores. m 


15 

8 

6 

9 

9 

4 

18 

10 

10 

12 

12 

4 

7 

8 

12 

10 

10 

11 

9 

13 

5 

6 

11 

14 

5 

6 

6 

5 

13 

5 


a) Calcule la media y la mediana de la cantidad de artículos. 

b) Estime el rango y la desviación estándar de la cantidad de artículos. 

c) Organice la cantidad de artículos en una distribución de frecuencias. Quizá desee repasar las 
instrucciones del capítulo 2 para establecer el intervalo de clase y el número de clases. 

d) Calcule la media y la desviación estándar de los datos organizados en una distribución de fre- 
cuencias. Compare estos valores con los que calculó en el inciso a). ¿Por qué son diferentes? 

84. La siguiente distribución de frecuencias contiene los costos de electricidad de una muestra de 50 
departamentos de dos recámaras en Albuquerque, Nuevo México, durante el mes de mayo del año 
pasado. 


Ejercicios de la base de datos 
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Costos de electricidad 

Frecuencia 

$ 80 a $100 

3 

100 a 120 

8 

120 a 140 

12 

140 a 160 

16 

160 a 180 

7 

180 a 200 

4 

Total 

50 


a) Calcule el costo medio. 

b) Aproxime la desviación estándar. 

c) Utilice la regla empírica para calcular la fracción de costos que se encuentra a dos desviacio- 
nes estándares de la media. ¿Cuáles son estos límites? 

85 . Bidwell Elctronics, Inc., tomó una muestra de empleados para determinar la distancia a la que 
viven de las oficinas centrales de la empresa. Los resultados aparecen a continuación. Calcule la 
media y la desviación estándar. 


Distancia (millas) 

Frecuencia 

M 

0 a 5 

4 

2.5 

5 a 10 

15 

7.5 

10 a 15 

27 

12.5 

15 a 20 

18 

17.5 

20 a 25 

6 

22.5 


Ejercicios de lo base de datos 

86. Consulte los datos Real Estate, que contienen información sobre casas que se vendieron en el área 
de Goodyear, Arizona, el año pasado. Redacte un breve informe sobre la distribución de los pre- 
cios de venta. Asegúrese de contestar, en dicho reporte, las siguientes preguntas: 

a) ¿Alrededor de cuáles variables tienden a concentrarse los datos? ¿Cuál es el precio medio de 
venta? ¿Cuál es el precio mediano de venta? ¿Es una medida más representativa que otras 
de los precios típicos de venta? 

£>) ¿Cuál es el rango de los precios de venta? ¿Cuál es la desviación estándar? ¿Entre cuáles valo- 
res se ubica cerca de 95% de los precios de venta? 

87 . Consulte los datos Baseball 2009, que incluyen información sobre los 30 equipos de la liga mayor 
durante la temporada 2009. Seleccione la variable que se refiere a los salarios de los equipos. 

a) Prepare un reporte sobre los salarios de los equipos y responda en él las siguientes preguntas: 

1. ¿Alrededor de cuáles valores tienden a acumularse los datos? En específico, ¿cuál es el 
salario medio? ¿Cuál es el salario mediano? ¿Es una medida más representativa que otras 
de los salarios típicos de los equipos? 

2 . ¿Cuál es el rango de los salarios? ¿Cuál es la desviación estándar? ¿Entre cuáles valores se 
ubica cerca de 95% de los salarios? 

b) Refiérase a la información sobre el salario promedio de cada año. En 1989, el salario promedio 
de un jugador fue de $512 930. En 2009, el salario promedio de un jugador se incrementó a 
$3 240 000. ¿Cuál fue el rango de incremento en el periodo? 

88. Consulte los datos sobre los autobuses del Distrito Escolar Buena. Prepare un reporte sobre el 
costo de mantenimiento del mes pasado. Responda las siguientes preguntas en dicho informe: 

a) ¿Alrededor de cuáles valores tienden a acumularse los datos? En específico, ¿cuál fue el costo 
medio de mantenimiento el mes pasado? ¿Cuál es el costo mediano? ¿Es una medida más 
representativa que otras del costo típico? 

b) ¿Cuál es el rango de los costos de mantenimiento? ¿Cuál es la desviación estándar? ¿Entre 
cuáles valores se ubica cerca de 95% de estos costos? 
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CAPÍTULO 3 Descripción de datos: medidas numéricas 


Comandos de software 


1. Los comandos de Excel de estadística descriptiva de la 
página 69 son los siguientes: 



a) Recupere ei archivo de datos de Applewood del sitio web 
del libro: www.mhhe.com/lind15e. 

b) De la barra de menú, seleccione Data y, en seguida, 

Data Analysis. Seleccione Descriptive Statistics y haga 
clic en OK. 

c) En Input Range, escriba C1:C181, indique que los datos 
se agrupan por columna y que las etiquetas se encuen- 
tran en la primera fila. Haga clic en Output Range, indi- 
que que la salida debe incluirse en G1 (o en cualquier 
lugar que desee), haga clic en Summary statistics y 
luego en OK. 

d ) Después de que obtenga los resultados, verifique dos 
veces la cuenta en la salida para cerciorarse de que con- 
tiene la cantidad correcta de elementos. 


2. Los comandos de Minitab para el resumen descriptivo de la 
página 84 son los siguientes: 



a) Recupere los datos de Applewood del sitio web del libro: 
www.mhhe.com/lind1 5e. 

b) Seleccione Stat, Basic Statistics y, en seguida, Display 
Descriptive Statistics. En el cuadro de diálogo seleccio- 
ne Profit como variable y haga clic en OK. 


Capítulo 3 


Respuestas a las autoevaluaciones 



3-1 


1. a) X = 


2X 


b) X = 


$267 100 


= $66 775 


c) Estadístico, pues se trata de un valor muestral. 

d) $66 775. La media de la muestra constituye nues- 
tra mejor aproximación de la media poblacional. 


2. a) 
b) 


R = 


R = 


2X 

" 77 " 

498 

6 


83 


c) Parámetro, porque se calculó empleando todos los 
valores de la población. 


3-2 a) $237, calculado de la siguiente manera: 

(95 X $400) + (126 X $200) + (79 X $100) 
95 + 126 + 79 


= $237.00 


3-3 


b) La ganancia por traje es de $12, que se determina 
mediante la operación $237 - costo de $200 - 
$25 de comisión. La ganancia total que generaron 
los 300 trajes es de $3 600, la cual se calcula mul- 
tiplicando 300 X $12. 

1. a) $878 
b) 3, 3 

2. a) 7, que se calcula mediante la operación 

(6 + 8)/2 = 7 

b) 3, 3 

c) 0 


Frecuencia 


Respuestas a las autoevaluaciones 
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3-4 a) 



Venta semanal 


b) Con sesgo positivo, ya que la media es el promedio 
más grande y la moda es el más pequeño. 

3-5 1. a) Alrededor de 9.9%, que se obtiene con la raíz 

</'\ .458602236, entonces 1 .099 - 1.00 = .099 

b) Alrededor de 10.095% 

c) Mayor que, porque 10.095 > 9.9 


2. 8.63%, que se determina mediante la operación 


120 520 
23 000 


1 = 1 .0863 - 1 


3-6 


a) 22 000 libras, que se determina restando 
112-90 

- 824 

b) X = = 103 miles de libras 

8 


X 

\x-x\ 

Desviación absoluta 

95 

— 8 | 

8 

103 

0 

0 

105 

I + 2 

2 

110 

I + 7 

7 

104 

+ 1 

1 

105 

1 + 2 

2 

112 

+9 

9 

90 

¡ — 1 3 ¡ 

13 



Total 42 


3-7 


a) n. 


42 

DM = — 
8 

_ $16 900 
5 


= 5.25 miles de libras 
= $3 380 


„ (3 536 - 3 380) 2 + • • • + (3 622 - 3 380) 2 

b) ff = 5 

(156) 2 + (— 207) 2 + (68) 2 

+ ( 259) 2 + (242) 2 
5 


c) 


197 454 
5 


39 490.8 


a = V39 490.8 = 198.72 


d) Hay más variación en la oficina de Pittsburgh, ya que 
la desviación estándar es mayor. La media también es 
mayor en la oficina de Pittsburgh. 

3-8 2.33, que se calcula de la siguiente manera: 



7 - 1 
= 2.33 

s = V2M = 1.53 


3-9 a) k = 


14.15 - 14.00 


.10 


= 1.5 


k = 


13.85 - 14.0 

Tío 


-1.5 


3-10 


1 - 


1 


(1-5) 2 

b) 13.8 y 14.2 


= 1 - .44 = .56 


a) Distribución de frecuencias. 


f 

M 

fM 

(M-X) 

f(M - X) 2 

1 

4 

4 

- 8.2 

67.24 

4 

8 

32 

- 4.2 

70.56 

10 

12 

120 

- 0.2 

0.40 

3 

16 

48 

3.8 

43.32 

2 

20 

40 

7.8 

121.68 

20 


244 


303.20 


- _ ZfM _ $244 

~ IvT ~ 20 


$12.20 


c) s = 


303.20 
20 - 1 


$3.99 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Descripción de datos: 

Presentación y análisis de datos 


OA1 Elaborar e interpretar un 
diagrama de puntos. 


OA2 Crear e interpretar una 
gráfica de tallo y hojas. 

OA3 Identificar y calcular 
medidas de posición. 

OA4 Construir e interpretar 
diagramas de caja. 

OA5 Calcular y entender el 
coeficiente de sesgo. 

OA6 Trazar e interpretar un 
diagrama de dispersión. 

OA7 Construir e interpretar 
una tabla de contingencia. 


■, m 

J •* 

KM 

* ***♦"■« 

i*** 

i*. t m 
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Recientemente, McGivem Jewelers colocó un anuncio en el periódico 
local en el que informaba la forma, tamaño, precio y grado de corte de 
33 de los diamantes que tenía en su inventario. Elabore el diagrama 
de caja de la variable precio y comente el resultado (vea ejercicio 37, 
objetivo 4). 



4.2 Diagramas de puntos 
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4.1 Introducción 

En el capítulo 2 se Inició el estudio de la estadística descriptiva. Con el fin de transformar datos 
que están en bruto o no agrupados en alguna forma significativa, es necesario organizados en 
una distribución de frecuencias, la cual se representa en forma gráfica en un histograma o en 
un polígono de frecuencias. Este arreglo permite visualizar el lugar en donde tienden a acumu- 
larse los datos, los valores máximo y mínimo y la forma general de los datos. 

En el capítulo 3 se calcularon primero diversas medidas de ubicación, tales como la media 
y la mediana, que permiten informar un valor típico de un conjunto de observaciones. También 
se calcularon diversas medidas de dispersión, tales como el rango y la desviación estándar, 
que permiten describir la variación o la dispersión en un conjunto de observaciones. 

En este capítulo continúa el estudio de la estadística descriptiva. Se presentan los siguien- 
tes temas: 1) diagramas de puntos; 2) gráfica de tallo y hojas; 3) percentiles, y 4) diagramas de 
caja. Estos diagramas y la estadística proporcionan una ¡dea adicional del lugar en el que los 
valores se concentran, así como de la forma general de los datos. En seguida se consideran 
datos bivariados de cada una de las observaciones individuales o seleccionadas. Algunos 
ejemplos incluyen: la cantidad de horas que estudia un alumno y los puntos que obtiene en un 
examen; si un producto tomado de la muestra es aceptable o no y el horario en el que se le 
fabrica; y la cantidad de electricidad que consume una casa en un mes, así como la tempera- 
tura alta media diaria de la reglón durante el mes. 


4.2 Diagramas de puntos 


OA1 Elaborar e interpretar 
un diagrama de puntos. 


Los diagramas de dispersión 
dan una idea visual de la dis- 
persión y concentración de 
los datos. 


Recuerde que en los datos de Applewood Auto Group, la ganancia obtenida por la venta de 
180 vehículos se resumió en ocho clases. Al organizar los datos en ocho clases se perdió el 
valor exacto de las observaciones. Por su parte, un diagrama de puntos agrupa los datos lo 
menos posible y evita la pérdida de identidad de cada observación. Para crear un diagrama 
de puntos se coloca un punto que representa a cada observación a lo largo de una recta 
numérica horizontal, la cual indica los valores posibles de los datos. Si hay observaciones 
Idénticas o las observaciones se encuentran muy próximas, los puntos se apilan uno sobre 
otro para que se puedan ver de manera individual. Esto permite distinguir la forma de la dis- 
tribución, el valor en torno al cual tienden a acumularse los datos y las observaciones máxima 
y mínima. Los diagramas de puntos son más útiles en el caso de conjuntos de datos peque- 
ños, mientras que los histogramas lo son para conjuntos grandes de datos. Un ejemplo mos- 
trará cómo construir e interpretar diagramas de puntos. 


Cjemplo 


Los departamentos de servicio de Honesta Ford Lincoln Mercury y Sheffield Motors Inc., dos 
de las cuatro distribuidoras de Applewood Auto Group, abrieron 24 días hábiles el mes pasa- 
do. A continuación aparece el número de vehículos que recibieron servicio el mes pasado en 
ambas distribuidoras. Elabore un diagrama de puntos y presente un resumen estadístico para 
comparar a estas dos distribuidoras. 


Tionesta Ford Lincoln Mercury 

Lunes 

Martes 

Miércoles 

Jueves 

Viernes 

Sábado 

23 

33 

27 

28 

39 

26 

30 

32 

28 

33 

35 

32 

29 

25 

36 

31 

32 

27 

35 

32 

35 

37 

36 

30 
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CAPÍTULO 4 Descripción de datos: presentación y análisis de datos 


Solución 




Sheffield Motors Inc. 

Lunes 

Martes 

Miércoles 

Jueves 

Viernes 

Sábado 

31 

35 

44 

36 

34 

37 

30 

37 

43 

31 

40 

31 

32 

44 

36 

34 

43 

36 

26 

38 

37 

30 

42 

33 


El sistema Minitab proporciona un diagrama de puntos y permite calcular la media, la media- 
na, los valores máximo y mínimo y la desviación estándar de la cantidad de automóviles que 
recibieron servicio en cada concesionaria durante los pasados 24 días hábiles. 



si 

30 

» 

2 

35 

V 

44 

X 

44 

43 

X 

V 
X 
Jl 
34 
X 
34 
40 
43 


• • • 
• • • • • 


¿ r T r*rv r f 
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ShtCCKK 


31 .2*2 
35. «3 


o. es* 
i-oi 


4.112 

4.44 


Winixt» 

23.0CO 

24.00 


Ql ll«4»4n 
21.000 02.000 
31.21 34.00 


03 lwtw« 

>00 30.000 

50 44.00 


Los esquemas de puntos que se muestran al centro de la captura de pantalla, ilustran gráfica- 
mente las distribuciones de ambas concesionarias. Los puntos muestran las diferencias en la 
ubicación y la dispersión de las observaciones. Al observar los esquemas de puntos, se puede 
ver que el número de vehículos que recibieron servicio en la distribuidora Sheffield están más 
dispersos y tienen una media mayor que los de Tionesta. Otras características del número de 
vehículos que recibieron servicio son: 

Tionesta dio servicio a menos vehículos en cualquier día dado, 23. 

Sheffield dio servicio a 26 autos en su día más bajo, 4 autos menos que en su siguiente 
día más bajo. 

Tionesta dio servicio exactamente a 32 vehículos en cuatro días diferentes. 

Los números de autos que recibieron servicio se acumulan alrededor del 36 en el caso de 
Sheffield y 32 en el de Tionesta. 

A partir de la estadística descriptiva, es posible visualizar que Sheffield dio servicio a un pro- 
medio de 35.83 vehículos diarios y Tionesta, un promedio de 31 .292 autos al día en el mismo 
periodo. También existe mayor dispersión, o variación, en el número diario de vehículos que 
recibieron servicio en Sheffield que en Tionesta. ¿Cómo se llega a esta conclusión? La desvia- 
ción estándar de Sheffield es mayor (4.96 automóviles por día) que la de Tionesta (4.1 12 carros 
por día). 
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4.3 Gráficas de tallo y hojas 

OA2 Crear e interpretar una En el capítulo 2 ilustramos la manera de organizar datos en una distribución de frecuencias de 

gráfica de tallo y hojas. tal manera que permitiera resumir los datos brutos de forma significativa. La ventaja principal 

de organizar los datos en la distribución de frecuencias estriba en que nos permite visuali- 
zar de manera rápida la forma de la distribución sin necesidad de llevar a cabo ningún cálcu- 
lo. En otras palabras, podemos ver dónde se concentran los datos y, asimismo, determinar si 
hay valores extremadamente grandes o pequeños. Sin embargo, hay dos desventajas que se 
presentan al organizar los datos en la distribución de frecuencias: 1) se pierde la identidad 
exacta de cada valor; 2) no es clara la forma en que los valores de cada clase se distribuyen. 
Para mayor precisión, la siguiente distribución de frecuencias muestra la cantidad de espacios 
publicitarios que compraron los 45 miembros de la Greater Buffalo Automobile Dealers 
Association durante el año 2010. Observe que 7 de las 45 concesionarias compraron de 90 a 
100 espacios. Sin embargo, ¿los espacios comprados en esta clase se acumulan en torno a 
90, se distribuyen uniformemente a lo largo de la clase o se acumulan cerca de 99? No es posi- 
ble afirmar nada. 



Estadística en acción 

En 1939 John W. Tukey 
(1915-2000) recibió un 
doctorado en matemáti- 
cas de Princeton. Sin 
embargo, cuando se unió 
a la Fire Control 
Research Office durante 
la Segunda Guerra 
Mundial, su interés en 
las matemáticas abstrac- 
tas se desvió hacia la esta- 
dística aplicada. Ideó 
métodos numéricos y grá- 
ficos eficaces para estu- 
diar los patrones que sub- 
yacían a los datos. Entre 
las gráficas que creó se 
encuentran el diagrama 
de tallo y hojas y el dia- 
grama de caja y bigotes o 
diagrama de caja. De 
1960 a 1980, Tukey enca- 
bezó la división de esta- 
dística electoral del equi- 
po de proyección noctur- 
no de la NBC. En 1960 
se hizo famoso, ya que 
evitó el anuncio de la vic- 
toria anticipada de 
Richard Nixon en las 
elecciones presidenciales 
que ganó John F. 
Kennedy. 


Cantidad de espacios comprados 

Frecuencia 

80 a 90 

2 

90 a 100 

7 

100 a 110 

6 

110 a 120 

9 

120 a 130 

8 

130 a 140 

7 

140 a 150 

3 

150 a 160 

3 

Total 

45 


Otra técnica que se utiliza para representar información cuantitativa en forma condensa- 
da es el diagrama de tallo y hojas. Una ventaja de este diagrama sobre la distribución de fre- 
cuencias consiste en que no se pierde la identidad de cada observación. En el ejemplo ante- 
rior, no se conoce la identidad de los valores en la clase de 90 a 100. Para ilustrar la forma de 
construir un diagrama de tallo y hojas a partir de la cantidad de espacios publicitarios com- 
prados, suponga que las siete observaciones en la clase del 90 a 100 son: 96, 94, 93, 94, 95, 
96 y 97. El valor de tallo es el dígito o dígitos principales, en este caso 9. Las hojas son los 
dígitos secundarios. El tallo se coloca a la izquierda de una línea vertical y los valores de las 
hojas a la derecha. 

Los valores en la clase de 90 a 100 se verían de la siguiente manera: 


9(6434567 


También es costumbre ordenar los valores en cada tallo de menor a mayor. Por consiguiente, 
la segunda fila del diagrama de tallo y hojas se vería de la siguiente manera: 


9| 3445667 


Con un diagrama de tallo y hojas es más fácil observar que dos concesionarias compraron 94 
espacios y que el número de espacios comprados varía de 93 a 97. Este tipo de diagrama se 
parece a una distribución de frecuencias, pero con mayor información, es decir, que la identi- 
dad de las observaciones se conserva. 


DIAGRAMA DE TALLO Y HOJAS Técnica estadística para presentar un conjunto de datos. Cada 
valor numérico se divide en dos partes. El dígito principal se convierte en el tallo y los dígi- 
tos secundarios en las hojas. El tallo se localiza a lo largo del eje vertical y los valores de las 
hojas se apilan unos contra otros a lo largo del eje horizontal. 
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El siguiente ejemplo explica los detalles para elaborar un diagrama de tallo y hojas. 


Cjemplo 


Solución 


La tabla 4-1 contiene la lista de la cantidad de espacios publicitarios de 30 segundos en radio 
que compró cada uno de los 45 miembros de la Greater Buffalo Automobile Dealers Association 
el año pasado. Organice los datos en un diagrama de tallo y hojas. ¿Alrededor de qué valores 
tiende a acumularse el número de espacios publicitarios? ¿Cuál es el número menor de espa- 
cios publicitarios comprados? ¿El número máximo de espacios comprados? 

Número de espacios publicitarios que compraron los miembros de la Greater 
Buffalo Automobile Dealers Association 


96 

93 

88 

117 

127 

95 

113 

96 

108 

94 

148 

156 

139 

142 

94 

107 

125 

155 

155 

103 

112 

127 

117 

120 

112 

135 

132 

111 

125 

104 

106 

139 

134 

119 

97 

89 

118 

136 

125 

143 

120 

103 

113 

124 

138 





De acuerdo con los datos de la tabla 4-1, el número mínimo de espacios publicitarios compra- 
dos es de 88. Por ello, el primer valor de tallo es 8. El número máximo es 156, así que los valo- 
res de tallo comienzan en 8 y continúan hasta 15. El primer número de la tabla 4-1 es 96, que 
tendrá un valor de tallo de 9 y un valor de hoja de 6. Al desplazarnos por el renglón superior, el 
segundo valor es de 93 y el tercero de 88. Después de considerar los primeros tres valores de 
datos, el diagrama queda de la siguiente manera: 



Al organizar los datos, el diagrama de tallo y hojas queda de la siguiente manera: 


Tallo 

Hoja 

8 

8 9 

9 

6356447 

10 

873463 

11 

732721983 

12 

75705504 

13 

9529468 

14 

8 2 3 

15 

6 5 5 


El procedimiento acostumbrado consiste en ordenar los valores de las hojas de menor a 
mayor. La última línea, la fila que se refiere a los valores próximos a 150, se vería de la siguien- 
te manera: 


15 


La tabla final sería la siguiente, en la cual están ordenados todos los valores de las hojas: 
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Tallo 

Hoja 

8 

8 9 

9 

3445667 

10 

334678 

11 

122337789 

12 

00455577 

13 

2456899 

14 

2 3 8 

15 

5 5 6 


Es posible deducir algunas conclusiones del diagrama de tallo y hojas. Primero, la canti- 
dad mínima de espacios publicitarios comprados es de 88 y la máxima de 156. Dos concesio- 
narias compraron menos de 90 espacios, y tres compraron 150 o más. Observe, por ejemplo, 
que las tres concesionarias que compraron más de 150 espacios, en realidad compraron 155, 
1 55 y 1 56 espacios. La concentración de la cantidad de espacios se encuentra entre 1 1 0 y 1 30. 
Hubo nueve concesionarias que compraron entre 110 y 119 espacios y ocho compraron entre 
120 y 129 espacios. También note que en el grupo ubicado entre 120 y 129 el número real de 
espacios comprados se distribuyó uniformemente. Es decir, que dos concesionarias compra- 
ron 120 espacios, una compró 124 espacios, tres compraron 125 espacios y dos compraron 
127 espacios. 

Además, es posible generar esta información en el sistema de software Minitab. La varia- 
ble se llama Spots. Abajo aparece la captura de pantalla de Minitab. Al final del capítulo usted 
puede encontrar los comandos de Minitab, que generan esta salida. 


DEBESII 

« ci 

SpOtf 

1 96 

2 93 

3 88 

4 117 

5 127 

6 96 

7 113 

8 96 

9 108 

10 94 

11 148 

12 156 

13 139 


La solución de Minitab proporciona información adicional relacionada con los totales acumu- 
lados. En la columna a la izquierda de los valores de tallo se encuentran números como 2, 9, 
15, y así sucesivamente. El número 9 indica que se presentaron 9 observaciones antes del valor 
de 100. El 15 muestra que se presentaron 15 observaciones antes de 110. Más o menos a la 
mitad de la columna aparece el número 9 entre paréntesis, que indica que el valor de en medio 
o mediana aparece en dicha fila y que hay nueve valores en este grupo. En este caso, el valor 
medio es el valor debajo del cual se presenta la mitad de las observaciones. Hay un total de 45 
observaciones, así que el valor medio, en caso de que los datos se ordenen de menor a mayor, 
sería la observación vigésima tercera; este valor es 118. Después de la mediana, los valores 
comienzan a decrecer. Estos valores representan los totales acumulados más que. Hay 21 
observaciones de 120 o más, 13 de 130 o más, y así sucesivamente. 


3 


Jir»-«nd-L«»í I>i*pl«y: Spot* 

9ta-«4-l(l( •( Spots > • 4S 
Le«f tkilt ■ 1.0 


2 

8 

n 

* 

* 

3445467 

15 

10 

334670 

(»> 

11 

122337709 

21 

12 

00455577 

13 

13 

2456099 

6 

14 

236 

3 

15 

556 


A 



108 


CAPÍTULO 4 Descripción de datos: presentación y análisis de datos 


¿Cuál es mejor: el esquema de puntos o el diagrama de tallo y hojas? En realidad, este 
dilema es cuestión de elección y conveniencia personal. Para presentar datos, en especial con 
una gran cantidad de observaciones, usted se dará cuenta de que los diagramas de puntos 
se utilizan con mayor frecuencia. Encontrará diagramas de puntos en la literatura analítica, 
informes de marketing y, en ocasiones, informes anuales. Si realiza un análisis rápido para 
usted mismo, los diagramas de tallo y hojas son accesibles y fáciles, en particular en relación 
con un conjunto pequeño de datos. 



1 . El siguiente diagrama muestra el número de empleados en cada una de las 1 42 tiendas de Home 
Depot ubicadas al sureste de Estados Unidos. 



a) ¿Cuáles son los números máximo y mínimo de empleados por tienda? 

b) ¿Cuántas tiendas emplean a 91 personas? 

c) ¿Alrededor de qué valores tiende a acumularse el número de empleados por tienda? 
2. La tasa de recuperación de 21 acciones es la siguiente: 


8.3 

9.6 

9.5 

9.1 

8.8 

11.2 

7.7 

10.1 

9.9 

10.8 


10.2 

8.0 

8.4 

8.1 

11.6 

9.6 

8.8 

8.0 

10.4 

9.8 

9.2 


Organice esta información en un diagrama de tallo y hojas. 

a) ¿Cuántas tasas son menores que 9.0? 

b ) Haga una lista de las tasas en la categoría que va de 10.0 a 1 1 .0. 

c) ¿Cual es la mediana? 

d) ¿Cuáles son las tasas máxima y mínima de recuperación? 
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Ejercicios 

1. Describa las diferencias entre un histograma y un diagrama de puntos. ¿Cuándo podría resultar 
mejor un diagrama de puntos que un histograma? 

2. Explique las diferencias entre un histograma y un diagrama de tallo y hojas. 

3. Considere el siguiente diagrama. 


: i 

i 

’ i • i • 

l 

1 


T T 1 T 

5 4 5 6 7 


a) ¿Qué nombre recibe este diagrama? 

b) ¿Cuántas observaciones hay en el estudio? 

c) ¿Cuáles son los valores máximo y mínimo? 

d) ¿En torno a qué valores tienden a acumularse las observaciones? 

4. El siguiente diagrama informa el número de teléfonos celulares que vendió Radio Shack durante 
los pasados 26 días. 


• 4 

: i 

• i * i i i 

• • • 

* t 

I I 

4 9 

l 

14 

T 

19 


a) ¿Cuáles son los números máximo y mínimo de teléfonos celulares vendidos en un día? 

b) ¿Cuál es el número típico de teléfonos celulares vendidos? 

5. La primera fila del diagrama de tallo y hojas es la siguiente: 62 1 1 3 3 7 9. Suponga que se trata 
de números enteros. 

a) ¿Cuál es el posible rango de los valores de esta fila? 
í>) ¿Cuántos valores de datos hay en esta fila? 

c) Haga una lista de los valores reales de esta fila de datos. 

6. La tercera fila de un diagrama de tallo y hojas aparece de la siguiente manera: 21 | 0 1 3 5 7 9. 
Suponga que los valores son números enteros. 

a) ¿Cuál es el posible rango de los valores de esta fila? 

b) ¿Cuántos valores de datos hay en esta fila? 

c) Elabore una lista de los valores reales de esta fila de datos. 

7. El siguiente diagrama de tallo y hojas del software de Minitab muestra el número de unidades 
producidas por día en una fábrica. 


i 

3 

8 

i 

4 


2 

5 

6 

9 

6 

0133559 

(7) 

7 

0236778 

9 

8 

59 

7 

9 

00156 

2 

10 

36 


a) ¿Cuántos días se registraron? 

í>) ¿Cuántas observaciones hay en la primera clase? 

c) ¿Cuál es el valor mínimo y el valor máximo? 
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d) Elabore una lista de los valores reales de la cuarta fila. 

e) Elabore una lista de los valores reales de la segunda fila. 

f) ¿Cuántos valores son menores que 70? 

g) ¿Cuántos valores son iguales a 80 o más? 

h) ¿Cuál es la mediana? 

/) ¿Cuántos valores se encuentran entre 60 y 89, inclusive? 

8. El siguiente diagrama de tallo y hojas presenta la cantidad de películas rentadas por día en Video 
Connection, ubicado en la esquina de las calles Forth y Main. 


3 

12 

689 

6 

13 

123 

10 

14 

6889 

13 

15 

589 

15 

16 

35 

20 

17 

24568 

23 

18 

268 

(5) 

19 

13456 

22 

20 

034679 

16 

21 

2239 

12 

22 

789 

9 

23 

00179 

4 

24 

8 

3 

25 

13 

1 

26 


1 

27 

0 


a) ¿Cuántos días se registraron? 

b ) ¿Cuántas observaciones hay en la última clase? 

c) ¿Cuáles son los valores máximo y mínimo de todo el conjunto de datos? 

d) Elabore una lista de valores reales de la cuarta fila. 

e) Elabore una lista de valores reales que aparecen en la penúltima fila. 

f) ¿En cuántos días se rentaron menos de 160 películas? 

g) ¿En cuántos días se rentaron 220 o más películas? 

h) ¿Cuál es el valor medio? 

/) ¿En cuántos días se rentaron entre 170 y 210 películas? 

9. Una encuesta sobre el número de llamadas telefónicas por celular realizada con una muestra de 
suscriptores de Verizon la semana pasada reveló la siguiente información. Elabore un diagrama 
de tallo y hojas. ¿Cuántas llamadas hizo un suscriptor típico? ¿Cuáles fueron los números máxi- 
mo y mínimo de llamadas que realizaron? m 


52 

43 

30 

38 

30 

42 

12 

46 

39 

37 

34 

46 

32 

18 

41 

5 




10. Aloha Banking Co. estudia el uso de cajeros automáticos en los suburbios de Honolulú. Una 
muestra de 30 cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de 
ayer. Elabore un diagrama de tallo y hojas. Resuma la cantidad de veces que se utilizó cada 
cajero automático. ¿Cuáles son los números mínimo y máximo de veces que se utilizó cada uno 
de ellos? 


83 

64 

84 

76 

84 

54 

75 

59 

70 

61 

63 

80 

84 

73 

68 

52 

65 

90 

52 

77 

95 

36 

78 

61 

59 

84 

95 

47 

87 

60 
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OA3 Identificar y calcular 
medidas de posición. 


Los cuartiles dividen un grupo 
de datos en cuatro partes. 


Cjemplo 


4.4 Otras medidas de posición 

La desviación estándar es la medida de dispersión que más se utiliza. No obstante, existen 
otras formas de describir la variación o dispersión de un conjunto de datos. Un método con- 
siste en determinar la ubicación de los valores que dividen un conjunto de observaciones en 
partes iguales. Estas medidas incluyen los cuartiles, deciles y percentiles. 

Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. Para expli- 
carlo mejor, piense en un conjunto de valores ordenados de menor a mayor. En el capítulo 3 
denominamos mediana al valor intermedio de un conjunto de datos ordenados de menor a 
mayor. Es decir que 50% de las observaciones son mayores que la mediana y 50% son meno- 
res. La mediana constituye una medida de ubicación, ya que señala el centro de los datos. De 
igual manera, los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. 
El primer cuartil, que se representa mediante Q-,, es el valor debajo del cual se presenta 25% 
de las observaciones, y el tercer cuartil, que simboliza Q 3 , es el valor debajo del cual se pre- 
senta 75% de las observaciones. Lógicamente, Q 2 es la mediana. Q 1 puede considerarse 
como la mediana de la mitad inferior de los datos y Q 3 como la mediana de la parte superior 
de los datos. 

Asimismo, los deciles dividen un conjunto de observaciones en 10 partes iguales y los 
percentiles en 100 partes iguales. Por lo tanto, si su promedio general en la universidad se 
encuentra en el octavo decil, usted podría concluir que 80% de los estudiantes tuvieron un 
promedio general inferior al suyo y 20%, un promedio superior. Un promedio general ubicado 
en el trigésimo tercer percentil significa que 33% de los estudiantes tienen un promedio gene- 
ral más bajo y 67% un promedio general más alto. Con frecuencia, en Estados Unidos, las cali- 
ficaciones que se expresan en percentiles se utilizan para dar a conocer resultados relaciona- 
dos con pruebas estandarizadas como SAT, ACT, GMAT (que se emplean para determinar el 
ingreso en algunas maestrías de administración de empresas) y LSAT (que sirve para determi- 
nar el ingreso a la escuela de leyes). 

Cuartiles, deciles y percentiles 

Para formalizar el proceso de cálculo, suponga que L p representa la ubicación de cierto per- 
centil que se busca. De esta manera, si quiere encontrar el trigésimo tercer percentil, utilizaría 
L 33 ; y si buscara la mediana, el percentil 50o., entonces L 50 . El número de observaciones es n; 
por lo tanto, si desea localizar la mediana, su posición se encuentra en ( n + 1)/2, o podría 
escribir esta expresión como ( n + 1)(P/100), en la que P representa el percentil que busca. 


LOCALIZACIÓN DE UN PERCENTIL 


Lp 


(n + 1 ) 


p 

Too 


(4-1) 


Un ejemplo ayudará a explicar la fórmula anterior. 


En seguida aparecen las comisiones que ganó el último mes una muestra de 15 corredores de 
bolsa de la oficina de Salomón Smith Barney’s Okland, California. Esta compañía de inversio- 
nes tiene oficinas a lo largo de Estados Unidos. 


$2 038 

$1 758 

$1 721 

$1 637 

$2 097 

$2 047 

$2 205 

$1 787 

$2 287 

1 940 

2 311 

2 054 

2 406 

1 471 

1 460 





Localice la mediana, el primer y el tercer cuartiles de las comisiones ganadas. 
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Solución 


El primer paso consiste en ordenar las comisiones ganadas de menor a mayor. 


$1 460 

$1 471 

$1 637 

$1 721 

$1 758 

$1 787 

$1 940 

$2 038 

2 047 

2 054 

2 097 

2 205 

2 287 

2 311 

2 406 




El valor mediano es la observación que se encuentra en el centro. El valor central, o L 50 , se lo- 
caliza en (n + 1) (50/1 00), en la que n representa el número de observaciones. En este caso es 
la posición número 8, determinada por (15 + 1 )(50/1 00). La octava comisión más grande es de 
$2 038. Así que ésta es la mediana y la mitad de los corredores obtiene comi- 
siones mayores que $2 038, y la mitad gana menos de $2 038. 

Recordemos la definición de cuartil. Los cuartiles dividen a un conjunto 
de observaciones en cuatro partes iguales. Por consiguiente, 25% de las 
observaciones serán menores que el primer cuartil. Setenta y cinco por cien- 
to de ellas serán menores que el tercer cuartil. Para localizar el primer cuartil, 
utilice la fórmula (4-1), en la cual n = 15 y P = 25: 


P 25 

L 7 , = (P + 1) — = (15 + 1)— = 4 

25 100 100 


para localizar el tercer cuartil, n = 15 y P = 75: 


P 75 

L ts = ( n + 1 ) 7 PP= O 5 + 1 ) 77 ^ = 12 


100 


100 


Por lo tanto, los valores del primer y tercer cuartiles se localizan en las posi- 
ciones 4 y 12. El cuarto valor en la serie ordenada es $1 721 y el decimose- 
gundo es $2 205. Éstos constituyen el primer y tercer cuartiles. 




En el ejemplo anterior, la fórmula de localización arrojó un número entero. Es decir que al 
buscar el primer cuartil había 15 observaciones, así que la fórmula de localización indica 
que debería encontrar el cuarto valor ordenado. ¿Si hubiera 20 observaciones en la muestra, 
es decir n = 20, y quisiera localizar el primer cuartil? De acuerdo con la fórmula de localiza- 
ción (4-1): 


L 


25 


(n + 1) 


P 

100 


(20 + 1 ) 


25 

100 


5.25 


Localizaría el quinto valor en la serie ordenada y en seguida se desplazaría una distancia de 
0.25 entre los valores quinto y sexto y señalaría a éste como el primer cuartil. Como en el caso 
de la mediana, el cuartil no necesita ser uno de los valores exactos del conjunto de datos. 

Para explicarlo más a fondo, suponga que un conjunto de datos contiene los seis valores: 
91, 75, 61, 101, 43 y 104. Trate de localizar el primer cuartil. Ordene los valores de menor a 
mayor: 43, 61, 75, 91, 101 y 104. El primer cuartil se localiza en 


L 


25 


(n + 1) 


P 

100 


(6 + 1) 


25 

100 


1.75 


La fórmula de localización indica que el primer cuartil se ubica entre el primero y segundo valo- 
res, lo que representa 0.75 de la distancia entre ellos. El primer valor es 43 y el segundo 61. 
De esta manera, la distancia entre estos valores es 18. Al localizar el primer cuartil, necesita 
desplazarse una distancia de 0.75 entre el primero y segundo valores; así, 0.75(18) = 13.5. 
Para completar el procedimiento, sume 13.5 al primer valor e indique que el primer cuartil 
es 56.5. 
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Es posible ampliar la ¡dea para incluir tanto declles como percentiles. Para localizar el 23o. 
percentil en una muestra de 80 observaciones, busque la posición 18.63. 

l » =( " + i ) 4- (80+i) ^ =18 ' 63 

Para determinar el valor correspondiente al 23o. percentil, localice el 18o. valor y el 19o., y 
determine la distancia entre ambos. Luego, multiplique esta diferencia por 0.63 y sume el 
resultado al valor más pequeño. El resultado sería el 23o. percentil. 

Con un paquete de software de estadística, resulta relativamente sencillo ordenar los 
datos de menor a mayor y localizar percentiles y deciles. Tanto las salidas de Minitab como de 
Excel generan resúmenes estadísticos. Abajo aparece una captura de pantalla de Minitab para 
los datos de las comisiones de Smith Barney. Los datos incluyen el primer y el tercer cuarti- 
les, así como la media, la mediana y la desviación. Se concluye que 25% de las comisiones 
fueron de menos de $1 721 y que 75% fueron menores a $2 205. Son los mismos valores 
reportados en el ejemplo previo. 



Excel y MegaStat, que se basa en Excel, calculan también los cuartiles y despliegan los 
resultados. Sin embargo, el método de solución que utilizan es ligeramente distinto. Para sim- 
plificar los problemas, asuma que el grupo de datos contiene un número impar de valores. El 
método descrito en el ejemplo, y soportado por Minitab, para el primer cuartil es: 

1 . Encuentre la mediana del grupo de n observaciones. 

2. Concéntrese sólo en las observaciones que están por debajo de la mediana de estos valo- 
res. Esto es, no considere a la mediana como parte del nuevo grupo de datos. 

3. Reporte este valor como el primer cuartil. 

En los datos de las comisiones de Smith Barney, la comisión mediana es la octava obser- 
vación en el grupo de 15 observaciones. Esta comisión es de $2 038. La mediana de estas 
siete observaciones se ubica en la cuarta posición, y tiene un valor de $1 721 , el mismo valor 
que se encontró en el ejemplo y en la salida de Minitab. 

A continuación se presenta una hoja de cálculo de Excel. También se muestran el prime- 
ro y tercer cuartiles de los datos de las comisiones de Smith Barney. Note que los resultados 
son diferentes. Nuevamente, para simplificar la situación, asuma que existe un número impar 
de valores. Excel encuentra la mediana a través del siguiente método: 

1. Encuentre la mediana en el grupo de n observaciones. 

2. Concéntrese en todas las observaciones que son iguales a o menores que la mediana. 
Esto es, incluya la mediana en el nuevo subgrupo de datos. 

3. Encuentre la mediana de este grupo de valores. 

4. Reporte este valor como primer cuartil. 
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En los datos de las comisiones de Smith Barney, la mediana de las 15 observaciones ori- 
ginales es $2 038. Por ello, el nuevo grupo de valores son las ocho observaciones ordenadas 
entre $1 460 y $2 038. La mediana está a medio camino entre $1 721 y $1 758, o $1 739, como 
reportó Excel. 



A 

B 

C D 

1 

$1,460.00 



2 

$1,471.00 



3 

$1,637.00 



4 

$1,721.00 


Cuartil 1 *$1,739.50 

5 

$1,758.00 



6 

$1,787.00 


Cuartil 3 r $2,151.00 

7 

$1,940.00 



8 

$2,038.00 



9 

$2,047.00 



10 

$2,054.00 



11 

$2,097.00 



12 

$2,205.00 



13 

$2,287.00 



14 

$2,311.00 



15 

$2,406.00 




De manera que la diferencia esencial entre los dos métodos es: 

• En el sistema Minitab, la mediana no se incluye en el subgrupo de datos. 

• En el sistema Excel, la mediana se incluye en el subgrupo de datos. 

En este ejemplo se consideraba un número impar de observaciones. ¿Qué pasa con el 
método de Excel si hay un número par de observaciones? En vez de utilizar la fórmula (4-1) 
para encontrar la ubicación, utiliza 0.25n + 0.75 para descubrir la posición del primer cuartil y 
0.75 n + 0.25 para hallar la posición del tercer cuartil. 

¿Es importante la diferencia? No, en realidad suele ser sólo una molestia. Por lo general, 
los estadísticos prefieren el primer método aquí expuesto. Cuando la muestra es grande, la 
diferencia entre los resultados de ambos métodos es pequeña. Por ejemplo, recuerde los 
datos de Applewood Auto Group, que reportan la información sobre las ganancias por las ven- 
tas de 180 vehículos. A continuación se presentan los resultados de Minitab y de Excel. ¡No 
hay mucha diferencia, sólo $7.00 en 180 vehículos! El reporte de cualquiera de estos valores 
haría muy poca diferencia en la Interpretación. 
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A 

8 

C 

D 

1 

A«e 

Proflt 



2 

44 

S234 



3 

40 

$323 



4 

42 

$335 

Cuartil 1 

1422.50 

5 

40 

S3S2 

Cuartil 3 

2268.30 

6 

46 

$369 



7 

53 

$377 



8 

30 

$443 



9 

40 

S4Í2 



10 

37 

$732 



11 

30 

S754 



12 

62 

$783 



13 

45 

$820 



14 

30 

$842 





comed 


Ejercicios 


11. Determine la mediana y los valores correspondientes al primer y tercer cuartiles en los siguientes 
datos. gj| 


46 

47 

49 

49 

51 

53 

54 

54 

55 

55 

59 


12. Determine la mediana y los valores correspondientes al primer y tercer cuartiles en los siguientes 
datos. g| 


5.24 

6.02 

6.67 

7.30 

7.59 

7.99 

8.03 

8.35 

8.81 

9.45 

9.61 

10.37 

10.39 

11.86 

12.22 

12.71 

13.07 

13.59 

13.89 

15.42 


13. Thomas Supply Company, Inc., es un distribuidor de generadores de gas. Como en cualquier 
negocio, el tiempo que emplean los clientes para pagar sus recibos es importante. En la siguien- 
te lista, en orden de menor a mayor, aparece el tiempo, en días, de una muestra de facturas de 
Thomas Supply Company, Inc. 


13 

13 

13 

20 

26 

27 

31 

34 

34 

34 

35 

35 

36 

37 

38 

41 

41 

41 

45 

47 

47 

47 

50 

51 

53 

54 

56 

62 

67 

82 


a) Determine el primer y tercer cuartiles. 

b) Determine el segundo y el octavo deciles. 

c) Determine el 67o. percentil. m 
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14. 


Kevin Hom es el gerente nacional de ventas de National Textbooks, Inc. Cuenta con un personal 
de ventas conformado por 40 personas, las cuales hacen visitas a profesores universitarios en 
todo Estados Unidos. Cada sábado por la mañana solicita a su personal que le envíe un informe, 
que debe incluir, entre otras cosas, la cantidad de profesores que visitaron la semana anterior. En 
la lista de abajo, en orden de menor a mayor, aparece la cantidad de visitas de la semana pasada. 



38 

40 

41 

45 

48 

48 

50 

50 

51 

51 

52 

52 

53 

54 

55 

55 

55 

56 

56 

57 

59 

59 

59 

62 

62 

62 

63 

64 

65 

66 

66 

67 

67 

69 

69 

71 

77 

78 

79 

79 


a) Determine la cantidad mediana de visitas. 

b) Determine el primer y tercer cuartiles. 

c) Determine el primero y el noveno deciles. 

d) Determine el 33o. percentil. 

Diagramas de caja 

0A4 Construir e interpretar Un diagrama de caja es una representación gráfica, basada en cuartiles, que ayuda a presen- 
diagramas de caja. tar un conjunto de datos. Para construir un diagrama de caja, sólo necesita cinco estadísticos: 

el valor mínimo, Q-, (primer cuartil), la mediana, Q 3 (tercer cuartil) y el valor máximo. Un ejem- 
plo ayudará a explicarlo. 


Cjemplo 


Solución 


Alexander’s Pizza ofrece entregas gratuitas de pizza a 15 millas a la redonda. Alex, el propie- 
tario, desea información relacionada con el tiempo de entrega. ¿Cuánto tiempo tarda una 
entrega típica? ¿En qué margen de tiempo deben completarse la mayoría de las entregas? En 
el caso de una muestra de 20 entregas, Alex recopiló la siguiente información: 

Valor mínimo = 13 minutos 
Qt = 15 minutos 
Mediana = 18 minutos 
Q 3 = 22 minutos 
Valor máximo = 30 minutos 

Elabore un diagrama de caja de los tiempos de entrega. ¿Qué conclusiones deduce sobre los 
tiempos de entrega? 

El primer paso para elaborar un diagrama de caja consiste en crear una escala adecuada a lo 
largo del eje horizontal. Luego, se debe dibujar una caja que inicie en Qt (15 minutos) y termi- 
ne en Q 3 (22 minutos). Dentro de la caja trazamos una línea vertical para representar a la media- 
na (18 minutos). Por último, prolongamos líneas horizontales a partir de la caja dirigidas al valor 
mínimo (13 minutos) y al valor máximo (30 minutos). Estas líneas horizontales que salen de la 
caja, a veces reciben el nombre de bigotes, en virtud de que se asemejan a los bigotes de un 
gato. 


Valor 

mínimo 


Mediana 


U-. 


Valor 

máximo 


J 


H 1 1 1 } 1 1 1- 


H h 


12 


14 


16 18 


20 


22 


24 


26 28 


30 32 

Minutos 
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El diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15 
y 22 minutos. La distancia entre los extremos de la caja, 7 minutos, es el rango intercuartil. 
Este rango, que es la distancia entre el primer y el tercer cuartiles, muestra la propagación o 
dispersión de la mayoría de las entregas. 




El diagrama de caja también revela que la distribución de los tiempos de entrega tiene un 
sesgo positivo. En el capítulo 3, página 70, recordemos que definimos el sesgo como la falta 
de simetría en un conjunto de datos. ¿Cómo sabe que esta distribución tiene un sesgo posi- 
tivo? En este caso hay dos piezas de información que lo sugieren. Primero, la línea punteada 
a la derecha de la caja, que va de 22 minutos (Q 3 ) al tiempo máximo de 30 minutos, es más 
larga que la línea punteada a la izquierda que va de 15 minutos (Q-,) al valor mínimo de 13 
minutos. En otras palabras, 25% de los datos mayores que el tercer cuartil se encuentran más 
dispersos que el 25% menor que el primer cuartil. Una segunda indicación del sesgo positivo 
es que la mediana no se encuentra al centro de la caja. La distancia del primer cuartil a la 
mediana es menor que la distancia de la mediana al tercer cuartil. El número de tiempos de 
entrega entre 15 y 18 minutos es el mismo que el número de tiempos de entrega entre 18 y 22 
minutos. 




Consulte los datos de Applewood Auto Group. Elabore un diagrama de caja con base en la 
variable edad del comprador. ¿Cuál es la conclusión respecto de la distribución de las edades 
de los compradores? 

Para crear el siguiente diagrama y resumen estadístico se utilizó el sistema de software de esta- 
dística de Minitab: 


tt IM||«K | 

• 

ct 
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71 
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La edad mediana de los compradores fue de 46 años; 25% de ellos tenían menos de 40 
años de edad, y 25% más de 52.75. Basándose en la información resumida y en el diagrama 
de caja, es posible concluir que: 

Cincuenta por ciento de los compradores están entre los 40 y los 52.75 años. 

La distribución de edades es simétrica. Existen dos razones para esta conclusión. La 
longitud del bigote por encima de los 52.75 años (Q 3 ) tiene aproximadamente el mismo 
largo que el bigote que está por debajo de los 40 años (Q-,). Asimismo, el área de la caja 
entre los 40 años y la mediana de 46 años es más o menos la misma que el área entre 
la mediana y los 52.75 años. 
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Hay tres asteriscos (*) por encima de los 70 años. ¿Qué es lo que indican? En un diagra- 
ma de caja, un asterisco identifica un dato atípico, es decir, que es un valor que no concuer- 
da con el resto de los datos. Se define como un valor más de 1 .5 veces la amplitud del rango 
intercuartil más pequeño que Q 1f o mayor que Q 3 . En este ejemplo, un dato atípico sería un 
valor mayor que 71 .875 años, el cual se determina con el siguiente cálculo: 


Dato atípico > Q 3 + 1.5(Q 3 - Q,) = 52.75 + 1.5(52.75 - 40) = 71.875 


Un valor menor que 20.875 años también es un dato atípico. 


Dato atípico < - 1.5 (Q 3 - Q-,) = 40 - 1.5(52.75 - 40) = 20.875 


Con base en el diagrama de caja, se concluye que hubo tres compradores de 72 años o 
mayores, y ninguno menor de 21 años. Nota técnica: en algunos casos, un solo asterisco 
puede representar más de una observación, en razón de las limitaciones del software y del 
espacio disponible. Es buena idea verificar los datos reales. En este caso, hubo tres compra- 
dores de 72 años o mayores: dos tienen 72 y uno tiene 73. 


Autoevaluación 4-3 



El siguiente diagrama de caja muestra los activos en millones de dólares de cooperativas de crédito 
en Seattle, Washington. 


0 


h H 


10 20 30 40 50 60 70 80 90 100 


¿Cuáles son los valores mínimo y máximo, los cuartiles primero y tercero, y la mediana? ¿Estaría 
usted de acuerdo en que la distribución es simétrica? ¿Hay datos atípicos? 


comed 


Ejercicios 

15. El diagrama de caja muestra la suma que se gastaron en libros y suministros durante un año los 
estudiantes de cuarto año de universidades públicas. 


$1 750 — 
1 400 — 
1 050 — 
700 — 
350 — 
0 — 


a) Calcule la mediana de la suma que se gastó. 

b) Calcule el primero y el tercer cuartiles de la cantidad que se gastó. 

c) Calcule el rango intercuartil de la cantidad que se gastó. 

d ) ¿Más allá de qué punto un valor se considera dato atípico? 
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OA5 Calcular y entender el 
coeficiente de sesgo. 


e) Identifique cualesquiera datos atípicos y calcule su valor. 

f) ¿Es la distribución simétrica, o tiene sesgo positivo o negativo? 

16. El diagrama de caja muestra el cargo interestatal de crédito por hora para carreras de cuatro años 
de estudiantes graduados en universidades públicas. 


$1 500 — 
1 200 — 
900 — 


600 — 
300 — 
0 — 


a) Calcule la mediana. 

¿>) Calcule el primer y tercer cuartiles. 

c) Determine el rango intercuartil. 

d) ¿Más allá de qué punto se considera dato atípico un valor? 

e) Identifique cualesquiera datos atípicos y calcule su valor. 

f ) ¿La distribución es simétrica, o tiene sesgo positivo o negativo? 

17. En un estudio sobre el rendimiento en millas por galón de gasolina de automóviles modelo 2011, 
la media fue de 27.5 y la mediana de 26.8. El valor más pequeño fue de 12.70 millas por galón y 
el más grande de 50.20. El primer y tercer intercuartiles fueron 17.95 y 35.45 millas por galón, res- 
pectivamente. Elabore un diagrama de caja y haga algún comentario sobre la distribución. ¿Es una 
distribución simétrica? 

18. Una muestra de 28 departamentos de tiempo compartido en el área de Orlando, Florida, reveló las 
siguientes tarifas diarias de una suite con una recámara. Por comodidad, los datos se encuentran 
ordenados de menor a mayor. Construya un diagrama de caja para representar los datos. Haga 
algún comentario sobre la distribución. Identifique el primer y tercer cuartiles, y la mediana. Sfg 


$116 

$121 

$157 

$192 

$207 

$209 

$209 

229 

232 

236 

236 

239 

243 

246 

260 

264 

276 

281 

283 

289 

296 

307 

309 

312 

317 

324 

341 

353 


4.5 Sesgo 

En el capítulo 3 se trataron las medidas de ubicación central de un conjunto de observaciones 
por medio de la presentación de un informe sobre la media, la mediana y la moda. También se 
describieron medidas que muestran el grado de propagación o variación de un conjunto de 
datos, como el rango y la desviación estándar. 

Otra característica de un conjunto de datos es la forma. Hay cuatro formas: simétrica, con 
sesgo positivo, con sesgo negativo y blmodal. En un conjunto simétrico de observaciones la 
media y la mediana son iguales, y los valores de datos se dispersan uniformemente en torno 
a estos valores. Los valores de datos debajo de la media y de la mediana constituyen una ima- 
gen especular de los datos arriba de estas medidas. Un conjunto de valores se encuentra ses- 
gado a la derecha o positivamente sesgado si existe un solo pico y los valores se extienden 
mucho más allá a la derecha del pico que a la Izquierda de éste. En este caso la media es más 
grande que la mediana. En una distribución negativamente sesgada existe un solo pico, pero 
las observaciones se extienden más a la izquierda, en dirección negativa. En una distribución 
negativamente sesgada, la media es menor que la mediana. Las distribuciones positivamente 
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El sesgo muestra la falta de 
simetría en un grupo de 
observaciones. 


sesgadas son más comunes. Con frecuencia, los salarlos obedecen este patrón. Piense en los 
salarios del personal de una pequeña compañía con alrededor de 1 00 empleados. El presiden- 
te y unos cuantos altos ejecutivos recibirían mucho más que los demás trabajadores, por lo 
que la distribución de salarlos mostraría un sesgo positivo. Una distribución bimodal tendrá 
dos o más picos. Con frecuencia éste es el caso cuando los valores provienen de dos o más 
poblaciones. Esta información se resume en la gráfica 4-1 . 


Simétrica 



Positivamente sesgada 



Negativamente sesgada Bimodal 



75 80 Calificación .98 1.04 Pulgadas 


GRÁFICA 4-1 Formas de los polígonos de frecuencias 



Estadística en acción 

El difunto Stephen Jay 
Gould (1941-2002) fue 
profesor de zoología y de 
geología en la 
Universidad de Harvard. 
En 1982 se le diagnosticó 
cáncer y le dieron ocho 
meses de vida. No obstan- 
te, y sin darse por venci- 
do, mostró en su investi- 
gación que la distribu- 
ción de tiempos de super- 
vivencia se encuentra 
drásticamente sesgada a 
la derecha y que no sólo 
50% de pacientes de cán- 
cer similar sobreviven 
más de 8 meses, sino que 
el tiempo de superviven- 
cia podía ser de años, no 
de meses. Sobre la base 
de su experiencia, escri- 
bió un ensayo varias veces 
publicado que se tituló 
“The Median Is not the 
Message” (La mediana 
no es el mensaje). 



En la literatura estadística se utilizan diversas fórmulas para calcular el sesgo. La más sen- 
cilla, Ideada por el profesor Karl Pearson (1857-1936), se basa en la diferencia entre la media 
y la mediana. 


X I \ 

3(X - Mediana) 

sk = — (4-2) 

V I J 


De acuerdo con esta expresión, el sesgo puede variar de —3 a 3. Un valor próximo a —3, como 
-2.57, indica un sesgo negativo considerable. Un valor como 1.63 indica un sesgo positivo 
moderado. Un valor de 0, que ocurre cuando la media y la mediana son ¡guales, Indica que la 
distribución es simétrica y que no se presenta ningún sesgo. 

En esta obra se presentan resultados que se obtuvieron con paquetes de software de 
estadística en Minitab y Excel. Con ambos se calcula un valor del coeficiente de sesgo basa- 
do en las desviaciones de la media elevadas al cubo. La fórmula es la siguiente: 


COEFICIENTE DE SESGO CALCULADO CON SOFTWARE sk 


(n - 1 )(n - 2) 


X - X 


(4-3) 


La fórmula (4-3) permite comprender la idea de sesgo. El miembro derecho de la fórmula 
es la diferencia entre cada valor y la media, dividida entre la desviación estándar. Esto corres- 
ponde a la porción (X - X)/s de la fórmula. Esta ¡dea recibe el nombre de estandarización. El 
concepto de estandarización de un valor se analiza con más detalle en el capítulo 7 cuando 
se describe la distribución de probabilidad normal. En este punto, observe que el resultado 
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consiste en la diferencia entre cada valor y la media en unidades de desviación estándar. Si la 
diferencia es positiva, el valor particular es más grande que la media; si la variación es nega- 
tiva, la cantidad estandarizada es menor que la media. Cuando eleva al cubo estos valores, 
conserva la información relativa a la diferencia. Recuerde que en la fórmula de la desviación 
estándar [vea fórmula (3-11)], se elevó al cuadrado la diferencia entre cada valor y la media de 
tal manera que, como resultado, todos los valores eran no negativos. 

Si el conjunto de valores de datos que se estudia es simétrico, al elevar al cubo los valo- 
res estandarizados y sumar todos los valores, el resultado se aproximaría a cero. Si hay varios 
valores grandes, claramente separados unos de otros, la suma de las diferencias al cubo 
sería un valor positivo grande. Valores mucho menores dan como resultado una suma al 
cubo negativa. 

Un ejemplo ilustrará la idea de sesgo. 


Cjemplo 


Solución 


En seguida aparecen las utilidades por acción que obtuvo una muestra de 15 compañías de 
software durante el año 2010. Las utilidades por acción se encuentran ordenadas de menor a 
mayor. 


$0.09 

$0.13 

$0.41 

$0.51 

$ 1.12 

$ 1.20 

$ 1.49 $3.18 

3.50 

6.36 

7.83 

8.92 

10.13 

12.99 

16.40 


Calcule la media, la mediana y la desviación estándar. Determine el coeficiente de sesgo utili- 
zando los métodos de Pearson y de software. ¿Qué concluye respecto de la forma de la dis- 
tribución? 

Éstos son los datos de la muestra, así que aplique la fórmula (3-2) para determinar la media: 

2X $74.26 


X = 


15 


= $4.95 


La mediana es el valor intermedio de un conjunto de datos, ordenados de menor a mayor. En 
este caso, el valor medio es $3.18, así la mediana de las utilidades por acción es $3.18. 

Emplee la fórmula (3-1 1) de la página 84 para calcular la desviación estándar de la mues- 
tra: 


s = 


2(X - X) 2 


($0.09 - $4.95) 2 + ■ ■ ■ + ($16.40 - $4.95) 2 


= $5.22 


n - 1 V 15-1 

El coeficiente de sesgo de Pearson es de 1 .01 7, calculado de la siguiente manera: 


sk = 


3(X - Mediana) 3($4.95 - $3.18) 
$5.22 


= 1.017 


Esto indica que existe un sesgo positivo moderado en los datos de las utilidades por acción. 

Cuando se utiliza el método del software resulta un valor similar, aunque no exactamente 
el mismo. Los detalles de los cálculos aparecen en la tabla 4-2. Para comenzar, determine la 
diferencia entre las utilidades por acción, así como la media, y divida el resultado entre la des- 
viación estándar. Recuerde que a esto se llama estandarización. Luego, eleve al cubo, es decir, 
eleve a la tercera potencia el resultado del primer paso. Por último, sume los valores elevados 
al cubo. Los detalles en el caso de la primera compañía, es decir, en la compañía con utilida- 
des de $0.09 por acción, son: 


X - X 


0.09 - 4.95 
5.22 


= (-0.931 0) 3 = -0.8070 
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TABLA 4-2 Cálculo del coeficiente de sesgo 


Utilidades por acción 

(X-X) 


s 

l s ; 

0.09 

-0.9310 

-0.8070 

0.13 

-0.9234 

-0.7873 

0.41 

-0.8697 

-0.6579 

0.51 

-0.8506 

-0.6154 

1.12 

-0.7337 

-0.3950 

1.20 

-0.7184 

-0.3708 

1.49 

-0.6628 

-0.2912 

3.18 

-0.3391 

-0.0390 

3.50 

-0.2778 

-0.0214 

6.36 

0.2701 

0.0197 

7.83 

0.5517 

0.1679 

8.92 

0.7605 

0.4399 

10.13 

0.9923 

0.9772 

12.99 

1 .5402 

3.6539 

16.40 

2.1935 

10.5537 

11.8274 


Cuando_sume los 15 valores cúbicos, el resultado es 11.8274. Es decir, el término 
2[(X - X)/s] 3 = 1 1 .8274. Para determinar el coeficiente de sesgo, utilice la fórmula (4-3), con 
n = 15. 


sk 


n 

(n ~ 1 )(n 



^y 


(15 


15 

1 )( 1 5 — 2 ) 


(11.8274) = 0.975 


La conclusión es que los valores de las utilidades por acción se encuentran un tanto ses- 
gadas positivamente. El siguiente diagrama, de Minitab, muestra las medidas descriptivas, 
como la media, la mediana y la desviación estándar de los datos por utilidades por acción. 
Incluye, asimismo, el coeficiente de sesgo y un histograma con una curva con forma de cam- 
pana superpuesta. 



1 


4.5 Sesgo 
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Una muestra de cinco capturistas de datos que laboran en la oficina de impuestos de Horry County 
revisó el siguiente número de expedientes fiscales durante la última hora: 73, 98, 60, 92 y 84. 
a) Calcule la media, la mediana y la desviación estándar. 
ti) Calcule el coeficiente de sesgo con el método de Pearson. 

c) Calcule el coeficiente de sesgo usando un paquete de software. 

d) ¿Qué conclusión obtiene respecto del sesgo de los datos? 


comed: 


Ejercicios 

En el caso de los ejercicios 19-22: 

a) Calcule la media, la mediana y la desviación estándar. 
ti) Calcule el coeficiente de sesgo con el método de Pearson. 
c) Estime el coeficiente de sesgo con un paquete de software. 

19. Los siguientes valores son los sueldos iniciales, en miles de dólares, de una muestra de cinco gra- 
duados de contabilidad, quienes aceptaron puestos de contaduría pública el año pasado. m 


36.0 26.0 33.0 28.0 31.0 


20. En la siguiente lista aparecen los salarios, en miles de dólares, de una muestra de 15 directores de 
finanzas de la industria electrónica. 


$516.0 

$548.0 

$566.0 

$534.0 

$586.0 

$529.0 

546.0 

523.0 

538.0 

523.0 

551.0 

552.0 

486.0 

558.0 

574.0 





21. A continuación aparece una lista de las comisiones (en miles de dólares) que percibieron el año 
pasado los representantes de ventas de Furniture Patch, Inc. 


$ 3.9 

$ 5.7 

$ 7.3 

$10.6 

$13.0 

$13.6 $15.1 

$15.8 $17.1 

17.4 

17.6 

22.3 

38.6 

43.2 

87.7 



22. La lista que sigue está conformada por los salarios de los 25 jugadores en la nómina del día de la 
apertura de los Yankees de Nueva York en 201 0. La información de los salarios se expresa en miles 
de dólares. 


Jugador 

Salario (miles 
de dólares) 

Posición 

Aceves, Alfredo 

435.7 

Pitcher 

Burnett, A.J. 

16 500.0 

Pitcher 

Cano, Robinson 

9 000.0 

Segunda base 

Cervelli, Francisco 

410.8 

Catcher 

Chamberlain, Joba 

488.0 

Pitcher 

Gardner, Brett 

452.5 

Jardinero 

Granderson, Curtís 

5 500.0 

Jardinero 

Hughes, Phil 

447.0 

Pitcher 

Jeter, Derek 

22 600.0 

Receptor 
de pase corto 

Johnson, Nick 

5 500.0 

Primera base 

Marte, Damaso 

4 000.0 

Pitcher 

Mitre, Sergio 

850.0 

Pitcher 


Jugador 

Salario (miles 
de dólares) 

Posición 

Park, Chan Ho 

1 200.0 

Pitcher 

Pena, Ramiro 

412.1 

Defensa 

Pettitte, Andy 

11 750.0 

Pitcher 

Posada, Jorge 

13 100.0 

Catcher 

Rivera, Mariano 

15 000.0 

Pitcher 

Robertson, David 

426.7 

Pitcher 

Rodríguez, Alex 

33 000.0 

Tercera base 

Sabathia, CC 

24 285.7 

Pitcher 

Swisher, Nick 

6 850.0 

Jardinero 

Teixeira, Mark 

20 625.0 

Primera base 

Thames, Marcus 

900.0 

Jardinero 

Vázquez, Javier 

11 500.0 

Pitcher 

Winn, Randy 

1 100.0 

Jardinero 
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4.6 Descripción de la relación entre dos variables 

En el capítulo 2 y en la primera sección de éste se han 
expuesto técnicas gráficas para resumir la distribución de 
una sola variable. En el capítulo 2 se empleó un histograma 
para resumir las ganancias por vehículos vendidos en 
Applewood Auto Group. En este capítulo las herramientas 
que se usaron fueron los diagramas de puntos y las gráficas 
de tallo y hojas para representar visualmente un conjunto de 
datos. En tanto que aparece una sola variable, se habla 
de datos univariables. 

Hay situaciones en las que se estudia y representa 
visualmente la relación entre dos variables. Al estudiar la 
relación entre ellas, se hace referencia a los datos como 
bivariados. Con frecuencia, los analistas de datos tratan de 
entender la relación entre dos variables. He aquí algunos 
ejemplos: 

• Tybo and Associates es una firma de abogados que se anuncia mucho en televisión. Los 
socios están considerando la forma de incrementar su presupuesto publicitario. Antes de 
hacerlo, les gustaría conocer la relación entre la cantidad que se gasta al mes en publici- 
dad y la cantidad total de cuentas por cobrar en dicho mes. En otras palabras, ¿un Incre- 
mento de la suma que se gasta en publicidad dará como resultado un incremento de las 
cuentas por cobrar? 

• Coastal Realty estudia sus precios de venta de casas. ¿Qué variables parecen estar rela- 
cionadas con ellos? Por ejemplo, ¿las casas más grandes se venden a un precio superior 
que las más pequeñas? Es probable. Por ello, Coastal tendría que estudiar la relación 
entre el área en pies cuadrados y el precio de venta. 

• El doctor Stephen Givens es experto en desarrollo humano. Estudia la relación entre la 
altura de los padres y la de sus hijos. Es decir, ¿los padres altos tienden a tener hijos 
altos? ¿Esperaría usted que Shaquille O’Neal, el basquetbolista profesional de siete pies 
y una pulgada de altura y 335 libras de peso tuviera hijos relativamente altos? 



0A6 Trazar e interpretar un 
diagrama de dispersión. 


El diagrama de dispersión se 
usa como forma de entender 
la relación entre dos varia- 
bles. 


Una técnica gráfica útil para mostrar la relación entre variables es el diagrama de dispersión. 

Para trazar un diagrama de dispersión son necesarias dos variables. Se escala una de las 
variables sobre el eje horizontal (eje X) de una gráfica y la otra variable a lo largo del eje verti- 
cal (eje Y). Por lo general, una de las variables depende hasta cierto grado de la otra. En el ter- 
cer ejemplo citado, la altura del hijo depende de la altura del padre. Así que se representa la 
altura del padre en el eje horizontal y la del hijo sobre el eje vertical. 

Un software de estadística, como Excel, sirve para ejecutar la función de trazo. Pre- 
caución: siempre se debe tener cuidado en la escala. Al cambiar la escala, ya sea del eje ver- 
tical o del eje horizontal, se afecta la fuerza de la relación visual. 

A continuación aparecen tres diagramas de dispersión (gráfica 4-2). El de la Izquierda 
muestra una mayor relación entre el tiempo de uso y el costo de mantenimiento durante el año 
pasado de una muestra de 10 autobuses propiedad de la ciudad de Cleveland, Ohio. Observe 
que a medida que se incrementa el tiempo de uso del autobús, también aumenta el costo 
anual de mantenimiento. El ejemplo del centro, relativo a una muestra de 20 vehículos, mues- 
tra una fuerte relación indirecta entre la lectura del odómetro y el precio de venta de remate. 
Es decir, conforme aumente el número de millas recorridas, el precio de venta de remate se 
reduce. El ejemplo de la derecha describe la relación entre la altura y el salarlo anual de una 
muestra de 15 supervisores de turno. Esta gráfica indica que existe poca relación entre la altu- 
ra y el salario anual. 
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Tiempo de uso de los autobuses 
y costo de mantenimiento 

$10 000 
8 000 
Sf 6 000 
ore. 4 000 
2 000 
0 

0 1 2 3 4 5 6 

Tiempo de uso (años) 



Precio de venta de remate 
■S frente a odómetro 

I $5 600 

H 5 200 

I 4 800 
| 4 400 
o 4 000 

O 
CD 

¿ 10 000 30 000 50 000 

Odómetro 



"O 

CD 

"O 



Altura frente a salario 


125 

120 

115 

110 

105 

100 

95 

90 


i — i — i — i — i — i — i — i — i — r 

5455 56 57 58 59 60 61 62 63 


Altura (pulgadas) 


GRÁFICA 4-2 


Tres ejemplos de diagramas de dispersión 


Cjemplo 


Solución 



En la introducción del capitulo 2 aparecen datos de Applewood Auto Group. Se reunió infor- 
mación sobre diversas variables, entre ellas la ganancia que se obtuvo por la venta de 180 ve- 
hículos el mes pasado. Además del monto de la ganancia en cada venta, otra de las variables 
es la edad del comprador. ¿Existe alguna relación entre la ganancia que se obtuvo por la venta 
de un vehículo y la edad del comprador? ¿Sería razonable concluir que se gana más en los ve- 
hículos que adquieren los compradores de más edad? 

Es posible investigar la relación entre la ganancia por vehículo vendido y la edad del compra- 
dor con un diagrama de dispersión. Represente la escala de edad sobre el eje horizontal, o eje 
X, y la ganancia sobre el eje vertical, o eje Y. Utilice Microsoft Excel para crear un diagrama de 
dispersión. Los comandos de Excel necesarios para la captura de pantalla se muestran en la 
sección Comandos de software ubicada al final del capítulo. 


AmtWOOD AUTO GROUP 


A 

1 Aje 


2 

i 

4 

5 
i 
7 
i 
5 
10 


11 29 

12 29 
11 10 

14 10 

15 JO 

16 11 

17 )! 


s 

Proflt 
SI. 147 
$1,734 
S1.S17 
$1.040 
$1.271 
$1.$29 
$3.002 
$1.931 
$2.492 
$1.204 
$1.342 
5443 
$734 
$1.621 
$«70 
$1,174 


Profit and Age of Buyer at Applewood 
Auto Group 



/ * ♦ 


W ♦ 


» • 
o 


10 20 10 «0 *0 «O 70 »0 

«üfM 


El diagrama de dispersión muestra una relación positiva entre las dos variables. No pare- 
ce haber mucha relación entre la ganancia por vehículo y la edad del comprador. En el capítu- 
lo 13 estudiaremos más ampliamente la relación entre variables, incluso calcularemos varias 
medidas numéricas para expresar la relación entre variables. 
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En el ejemplo anterior hay una débil relación positiva, o directa, entre las variables. Sin 
embargo, hay muchos casos en los que existe una relación entre las variables, pero dicha rela- 
ción es inversa o negativa. Por ejemplo: 

• El valor de un vehículo y el número de millas recorridas. Conforme la cantidad de millas 
se incrementa, el valor del vehículo desciende. 

• La prima de un seguro de automóvil y la edad del conductor. Las cuotas de automóvil tien- 
den ser las más altas para los adultos jóvenes y menores para personas de más edad. 

• En el caso de muchos oficiales encargados de hacer que se cumpla la ley, conforme 
aumenta el número de años de trabajo, la cantidad de multas de tránsito disminuye. Esto 
puede deberse a que el personal se torna más liberal en sus interpretaciones o a que quizá 
tengan puestos de supervisión y no un cargo en el que puedan levantar tantas multas. 
Pero en cualquier caso, conforme la edad aumenta, la cantidad de multas se reduce. 

Un diagrama de dispersión requiere que las dos variables sean por lo menos de escala de 
intervalo. En el ejemplo de Applewood Auto Group, tanto la edad como la ganancia de la venta 
son variables de escala de razón. La altura también es una escala de razón, según la manera 
en la que se utilizó en el estudio de la relación entre la altura de los padres y la de los hijos. ¿Y 
si desea estudiar la relación entre dos variables cuando una o ambas son de escala nominal u 
ordinal? En este caso, debe registrar los resultados en una tabla de contingencia. 


0A7 Construir e interpretar 
una tabla de contingencia. 


TABLA DE CONTINGENCIA Tabla que se utiliza para clasificar observaciones de acuerdo con 
dos características identificables. 


Una tabla de contingencia es una tabulación cruzada, que resume simultáneamente dos 
variables de Interés. Por ejemplo: 

• Los estudiantes en una universidad se clasifican por género y lugar en la clase. 

• Un producto se clasifica como aceptable o Inaceptable y de acuerdo con el turno (matu- 
tino, vespertino, nocturno) en el que se le fabrica. 

• Un votante de una escuela que lleva a cabo un referendo para otorgar becas se clasifica 
de acuerdo con su afiliación partidista (demócrata, republicano u otro), y el número de 
hijos que asisten a la escuela del distrito (0, 1 , 2, etcétera). 


Cjemplo 


Solución 


Hay cuatro distribuidoras en el Applewood Auto Group. Suponga que desea comparar la 
ganancia que se obtuvo por cada vehículo vendido por una concesionaria en particular. Dicho 
de otra forma, ¿existe una relación entre el monto de ganancia y la distribuidora? 

El nivel de medida de la variable concesionaria es nominal y de razón en el caso de la variable 
ganancia. Para usar con eficiencia una tabla de contingencias, ambas variables deben ser ya 
sea nominales u ordinales. Para hacer que las variables sean compatibles, hay que clasificar la 
variable ganancia en dos categorías: aquellos casos en los que la ganancia que se obtuvo es 
mayor a la mediana, y aquellos en que es menor. En la página 69 se calculó que la ganancia 
mediana por todas las ventas del mes pasado en Applewood Auto Group es de $1 882.50. 


Tabla de contingencia sobre la relación entre ganancia y concesionaria 


Abajo/arriba 


Ganancia mediana Kane 

Olean 

Sheffield 

Tionesta 

Total 

Por abajo 

25 

20 

19 

26 

90 

Por arriba 

27 

20 

26 

17 

90 

Total 

52 

40 

45 

43 

180 
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Si se organiza la información en una tabla de contingencia, es posible comparar la ganan- 
cia de las cuatro distribuidoras. Se observa lo siguiente: 

De la columna Total a la derecha, 90 de los 180 autos vendidos dieron una ganancia por 
encima de la mediana, y la otra mitad, por debajo. Esto era lo esperado, dada la definición 
de mediana. 

En el caso de la distribuidora Kane, 25 de los 52 vehículos, o 48%, fueron vendidos con 
una ganancia mayor a la mediana. 

El porcentaje de ganancias por encima de la mediana de las otras concesionarias es 50% 
en el caso de Olean, 42% en el de Sheffield y 60% en el de Tionesta. 


Volveremos al estudio de las tablas de contingencia en el capítulo 5 cuando veamos la 
probabilidad, y en el capítulo 17 cuando estudiemos los métodos no paramétricos de análisis. 



El grupo de rock Blue String Beans está de gira por Estados Unidos. El siguiente diagrama muestra 
la relación entre el cupo para el concierto y el ingreso en miles de dólares en una muestra de con- 
ciertos. 



2 - • 


5 800 6 300 6 800 7 300 

Cupo 


a) ¿Qué nombre recibe el diagrama? 

b) ¿Cuántos conciertos se estudiaron? 

c) Calcule los ingresos de un concierto con lleno total. 

d) ¿Cómo caracterizaría la relación entre ingresos y cupo? ¿Es fuerte o débil, directa o inversa? 


comed 


Ejercicios 

23. Elabore el diagrama de dispersión de los siguientes datos tomados de una muestra. ¿Cómo 
describiría la relación entre los valores? m 


Valor X 

Valor Y 

Valor X 

Valor Y 

10 

6 

11 

6 

8 

2 

10 

5 

9 

6 

7 

2 

11 

5 

7 

3 

13 

7 

11 

7 
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24. Silver Springs Moving and Storage, Inc., estudia la relación que existe entre el número de habita- 
ciones en una mudanza y el número de horas que se requieren de trabajo para completarla. 
Como parte del análisis, el director de finanzas de Silver Springs creó el siguiente diagrama de 
dispersión. 


40 

30 

20 

10 

0 



Habitaciones 


a) ¿Cuántas mudanzas se incluyen en la muestra? 

í>) ¿Parece que se requieren más horas de trabajo si la cantidad de habitaciones se incrementa, 
o las horas de trabajo disminuyen si aumenta la cantidad de habitaciones? 

25. El director de planeación de Devine Dining, Inc., desea estudiar la relación entre el género de 
un huésped y si éste ordena postre. Para investigar esta relación, recopiló la siguiente informa- 
ción de 200 consumidores. 


Orden de postre 

Género 

Hombre Mujer 

Total 

Sí 

32 

15 

47 

No 

68 

85 

153 

Total 

100 

100 

200 


a) ¿Cuál es el nivel de medición de las dos variables? 

b) ¿Qué nombre recibe esta tabla? 

c) A partir de la evidencia que ofrece ia tabla, ¿los hombres piden más postre que las mujeres? 
Explique su respuesta. 

26. Sky Resorts Inc., de Vermont, considera su fusión con Gulf Shores, Inc., de Alabama. El con- 
sejo directivo encuesto a 50 accionistas acerca de su posición sobre la fusión. Los resultados 
aparecen en seguida. 


Número de participación 

A favor 

Opinión 

En contra 

Indeciso 

Total 

Menos de 200 

8 

6 

2 

16 

200 a 1 000 

6 

8 

1 

15 

Más de 1 000 

6 

12 

1 

19 

Total 

20 

26 

4 

50 


a) ¿Cuál es el nivel de medición que se empleó en la tabla? 
í>) ¿Qué nombre recibe esta tabla? 

c) ¿Qué grupo parece oponerse con más fuerza a la fusión? 
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Resumen del capítulo 

I. Un diagrama de puntos muestra el rango de valores sobre el eje horizontal, y se coloca un punto 
por encima de cada uno de los valores. 

A. Un diagrama de puntos muestra los detalles de cada observación. 

B. Es de utilidad para comparar dos o más conjuntos de datos. 

II. Un diagrama de tallo y hojas constituye una alternativa al histograma. 

A. El dígito principal es el tallo y el dígito secundario, la hoja. 

B. Las ventajas de un diagrama de tallo y hojas sobre un histograma incluyen las siguientes: 

1. La identidad de cada observación no se pierde. 

2. Los dígitos proporcionan una representación de la distribución. 

3. También se exhiben las frecuencias acumulativas. 

III. Las medidas de localización describen la forma de un conjunto de observaciones. 

A. Los cuartiles dividen un conjunto de observaciones en cuatro partes iguales. 

1. Veinticinco por ciento de las observaciones son menores que el primer cuartil, 50% son 
menores que el segundo cuartil y 75% son menores que el tercer cuartil. 

2. El rango intercuartil es la diferencia entre el tercer y el primer cuartiles. 

B. Los deciles dividen a un conjunto de observaciones en diez partes iguales y los percentiles en 
100 partes iguales. 

C. Un diagrama de caja es una representación gráfica de un conjunto de datos. 

1. Se traza una caja que encierra las regiones entre el primer y tercer cuartiles. 

a) Se dibuja una línea en el interior de la caja en el valor intermedio. 

b) Los segmentos punteados se prolongan a partir del tercer cuartil hasta el valor más alto 
con el fin de mostrar el 25% más alto y a partir del primer cuartil hasta el valor más 
bajo con el fin de mostrar el 25% más bajo de los valores. 

2. Un diagrama de caja se basa en cinco estadísticos: los valores máximo y mínimo, el primer 
y tercer cuartiles y la mediana. 

IV. El coeficiente de sesgo es una medida de la simetría de una distribución. 

A. Existen dos fórmulas para determinar el coeficiente de sesgo. 

1. La fórmula que elaboró Pearson es: 


sk 


3(X - Mediana) 
s 


( 4 - 2 ) 


2. El coeficiente de sesgo calculado con un software de estadística es: 


sk 


n 

(n - 1)(n - 2) 


2 


x-x ^ 3 

s 


( 4 - 3 ) 


V. Un diagrama de dispersión es una herramienta gráfica para representar la relación entre dos varia- 
bles. 

A. Ambas variables se miden con escalas de intervalo o de razón. 

B. Si la propagación de los puntos se dirige de la parte inferior izquierda a la parte superior dere- 
cha, las variables que se estudian se encuentran directa o positivamente relacionadas. 

C. Si la dispersión de los puntos se orienta de la parte superior izquierda a la inferior derecha, las 
variables se encuentran relacionadas inversa o negativamente. 

VI. Una tabla de contingencia se utiliza para clasificar observaciones de escala nominal de acuerdo con 
dos características. 


Clavo de pronunciación 

SÍMBOLO SIGNIFICADO 

L p Ubicación del percentil 

Q 1 Primer cuartil 

Q 3 Tercer cuartil 


PRONUNCIACIÓN 

L subíndice p 
Q subíndice 1 
Q subíndice 3 
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comed 


€jercic¡os del copítulo 

27. Se le preguntó a una muestra de estudiantes que asiste a la Southeast Florida University por la 
cantidad de actividades sociales en las que participaron la semana pasada. El diagrama que apa- 
rece en seguida se construyó a partir de datos tomados de la muestra. 


i 

+ 

o 




i 


8 

+ 

2 


Actividades 


+ 

3 


+ 

4 


a) ¿Cuál es el nombre que se da a este diagrama? 
ib) ¿Cuántos estudiantes se incluyeron en el estudio? 

c) ¿Cuántos estudiantes informaron que no asistían a ninguna actividad social? 

28. Doctor’s Care es una clínica ambulatoria que tiene sucursales en Georgetown, Monks Corners y 
Aynor, y en la cual los pacientes reciben tratamiento por lesiones menores, resfriados, gripes y se 
les practican exámenes físicos. Los siguientes diagramas muestran la cantidad de pacientes que 
se trataron en las tres sucursales el mes pasado. 


Ubicación 

(nfinrgptnwn •• 

• • 

MM • *8 8 M* 8* • «M 


Mnnk Dnrnfirs • 

8 ~U 88. 

1 1 1 

8 ... 88 8. • ~ 

1 
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• «8 

1 1 1 

mS n • • «8 • 8 • *8 m * 

1 

• • 

10 

i i i 

20 30 40 

Pacientes 

_ o 

LO 


Describa el número de pacientes atendidos en las tres sucursales cada día. ¿Cuáles son los núme- 
ros máximo y mínimo de pacientes que se atendieron en cada una de las sucursales? 

29. A continuación se proporciona el tamaño de la pantalla de 23 televisores LCD. Elabore un diagra- 
ma de tallos y hojas de esta variable r J 


46 

52 

46 

40 

42 

46 

40 

37 

46 

40 

52 

32 

37 

32 

52 

40 

32 

52 

40 

52 

46 

46 

52 









30. La siguiente tabla muestra las 25 compañías (ordenadas por capitalización del mercado) que ope- 
ran en el área de Washington, DC, junto al año en que fueron fundadas y el número de empleados. 
Elabore un diagrama de tallo y hojas de estas variables y escriba una breve descripción de sus 
hallazgos. 


Compañia 

Año de fundación 

Empleados 

AES Corp. 

1981 

30 000 

American Capital Strategies Ltd. 

1986 

484 

AvalonBay Communities Inc. 

1978 

1 767 

Capital One Financial Corp. 

1995 

31 800 

Constellation Energy Group Inc. 

1816 

9 736 

Coventry Health Care Inc. 

1986 

10 250 

Danaher Corp. 

1984 

45 000 

Dominion Resources Inc. 

1909 

17 500 

Fannie Mae 

1938 

6 450 

Freddie Mac 

1970 

5 533 



(continúa) 
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Compañía 

Año de fundación 

Empleados 

Gannett Co. 

1906 

49 675 

General Dynamics Corp. 

1952 

81 000 

Genworth Financial Inc. 

2004 

7 200 

Harman International Industries Inc. 

1980 

11 246 

Host Hotels & Resorts Inc. 

1927 

229 

Legg Masón Inc. 

1899 

3 800 

Lockheed Martin Corp. 

1995 

140 000 

Marriott International Inc. 

1927 

151 000 

Medlmmune Inc. 

1988 

2 516 

Nll Holdings Inc. 

1996 

7 748 

Norfolk Southern Corp. 

1982 

30 594 

Pepeo Holdings Inc. 

1896 

5 057 

Sallie Mae 

1972 

11 456 

Sprint Nextel Corp. 

1899 

64 000 

T. Rowe Price Group Inc. 

1937 

4 605 

The Washington Post Co. 

1877 

17 100 


31. En años recientes, como consecuencia de las bajas tasas de interés, muchos propietarios de 
casas refinanciaron sus créditos. Linda Lahey es agente hipotecaria de Down River Federal 
Savings and Loan. A continuación aparecen las sumas refinanciadas de 20 préstamos a los que 
les dio curso la semana pasada. Los datos se expresan en miles de dólares y se encuentran orde- 
nados de menor a mayor. 


59.2 

59.5 

61.6 

65.5 

66.6 

72.9 

74.8 

77.3 

79.2 

83.7 

85.6 

85.8 

86.6 

87.0 

87.1 

90.2 

93.3 

98.6 

100.2 

100.7 









a) Calcule la mediana, el primer cuartil y el tercer cuartil. 

b) Determine los percentiles 26o. y 83o. 

c) Trace un diagrama de caja de los datos. 

32. La industria disquera de Estados Unidos lleva a cabo un estudio sobre el número de discos com- 
pactos de música que poseen las personas de la tercera edad y los adultos jóvenes. La informa- 
ción aparece en seguida. 


Adultos de la tercera edad 

28 

35 

41 

48 

52 

81 

97 

98 

98 

99 

118 

132 

133 

140 

145 

147 

153 

158 

162 

174 

177 

180 

180 

187 

188 







Adultos jóvenes 


81 

107 

113 

147 

147 

175 

183 

192 

202 

209 

233 

251 

254 

266 

283 

284 

284 

316 

372 

401 

417 

423 

490 

500 

507 

518 

550 

557 

590 

594 


a) Calcule la mediana y el primer y tercer cuartiles del número de compactos que poseen los ciu- 
dadanos de la tercera edad. Diseñe un diagrama de caja de la información, 
ib) Calcule la mediana, el primer y tercer cuartiles del número de compactos que poseen los adul- 
tos jóvenes. Diseñe un diagrama de caja de la información, 
c) Compare el número de compactos que poseen ambos grupos. 

33. Las oficinas centrales de la empresa Bank.com, una empresa nueva de internet que realiza todas 
las transacciones bancarias a través de la red, se localizan en el centro de Filadelfia. El director de 
recursos humanos lleva a cabo un estudio relacionado con el tiempo que invierten ios emplea- 
dos en llegar al trabajo. La ciudad hace planes para ofrecer incentivos a las empresas que se ubi- 
quen en el centro si estimulan a sus empleados a utilizar el transporte público. A continuación apa- 
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rece una lista del tiempo que se requirió esta mañana para llegar al trabajo según el empleado haya 
utilizado el transporte público o su automóvil. m 


Transporte público 


23 25 25 30 31 31 32 33 35 36 

37 42 


Particular 


32 32 33 34 37 37 38 38 38 39 

40 44 


a) Calcule la mediana, el primer y tercer cuartiles del tiempo de desplazamiento de los empleados 
utilizando el transporte público. Elabore un diagrama de caja para la información. 

b) Calcule la mediana, el primer y tercer cuartiles del tiempo de desplazamiento de los empleados 
en su propio vehículo. Elabore un diagrama de caja para la información. 

c) Compare los tiempos de los dos grupos. 

34. El siguiente diagrama de caja muestra la cantidad de diarios que se publican en cada estado y en 
el Distrito de Columbia. Redacte un breve informe para resumir la cantidad que se publicó. 
Cerciórese de incluir información relativa a los valores del primer y tercer cuartiles, la mediana y si 
existe algún sesgo. Si hay datos atípicos, calcule su valor. 



** ** 


O O O O O O 

cnj co oo o 

Número de diarios 

35. Walter Gogel Company es un proveedor industrial de cinturones de seguridad, herramientas y 
resortes. Las sumas de sus ingresos varían mucho, desde menos de $20.00 hasta más de 
$400.00. Durante el mes de enero enviaron 80 facturas. El siguiente es un diagrama de caja de es- 
tas facturas. Redacte un breve informe que resuma los montos de las facturas. Incluya informa- 
ción sobre los valores del primer y tercer cuartiles, la mediana y si existe algún sesgo. Si hay datos 
atípicos, aproxime el valor de estas facturas. 



o o o o o o 

m o Ln o Ln 

i— t— c\i CM 

Monto de facturas 

36. La American Society of PeriAnesthesia Nurses (ASPAN: www.aspan.org) es una organización esta- 
dounidense que agrupa a enfermeras que se desempeñan en el cuidado preanestesia y posanes- 
tesia en cirugías ambulatorias. La organización comprende 40 componentes, que se enlistan a 
continuación. 


Estado/región 

Membresía 

Alabama 

95 

Arizona 

399 

Maryland, Delaware, DC 

531 

Connecticut 

239 

Florida 

631 

Georgia 

384 

Hawaii 

73 


Estado/región 

Membresía 

Illinois 

562 

Indiana 

270 

lowa 

117 

Kentucky 

197 

Louisiana 

258 

Michigan 

411 

Massachusetts 

480 


(i continúa ) 
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Estado/región 

Membresía 

Estado/región 

Membresía 

Maine 

97 

California 

1 165 

Minnesota, Dakotas 

289 

New México 

79 

Missouri, Kansas 

282 

Pennsylvania 

575 

Mississippi 

90 

Rhode Island 

53 

Nebraska 

115 

Colorado 

409 

North Carolina 

542 

South Carolina 

237 

Nevada 

106 

Texas 

1 026 

New Jersey, Bermuda 

517 

Tennessee 

167 

Alaska, Idaho, Montana, 


Utah 

67 

Oregon, Washington 

708 

Virginia 

414 

New York 

891 

Vermont, 


Ohio 

708 

New Hampshire 

144 

Oklahoma 

171 

Wisconsin 

311 

Arkansas 

68 

West Virginia 

62 


Utilice un software estadístico para responder las siguientes preguntas. 

a) Encuentre la media, la mediana y la desviación estándar del número de miembros por compo- 
nente. 

£>) Ubique el coeficiente de sesgo mediante el software. ¿Cuál es su conclusión con respecto a la 
forma de la distribución del tamaño del componente? 

c) Determine ei primer y tercer cuartiles. No utilice el método descrito por Excel. 

d) Desarrolle un diagrama de caja. ¿Hay datos atípicos? ¿Cuáles componentes son atípicos? 
¿Cuáles son los límites de los componentes atípicos? 

37 . McGivern Jewelers se ubica en Levis Square Malí, al sur de Toledo, Ohio. Recientemente publicó 
un anuncio en el periódico local en el que indicaba la forma, el tamaño, el precio y el grado de corte 
de 33 de sus diamantes en existencia. La información se muestra a continuación. 


Forma 

Tamaño (quilates) 

Precio 

Grado de corte 

Forma Tamaño (quilates) 

Precio 

Grado de corte 

Princesa 

5.03 

$44 312 

Corte ideal 

Redonda 

0.77 

$2 828 

Corte ultraideal 

Redonda 

2.35 

20 413 

Corte perfeccionado 

Oval 

0.76 

3 808 

Corte perfeccionado 

Redonda 

2.03 

13 080 

Corte ideal 

Princesa 

0.71 

2 327 

Corte perfeccionado 

Redonda 

1.56 

13 925 

Corte ideal 

Talla de 58 facetas 

0.71 

2 732 

Buen corte 

Redonda 

1.21 

7 382 

Corte ultraideal 

Redonda 

0.70 

1 915 

Corte perfeccionado 

Redonda 

1.21 

5 154 

Corte promedio 

Redonda 

0.66 

1 885 

Corte perfeccionado 

Redonda 

1.19 

5 339 

Corte perfeccionado 

Redonda 

0.62 

1 397 

Buen corte 

Esmeralda 

1.16 

5 161 

Corte ideal 

Redonda 

0.52 

2 555 

Corte perfeccionado 

Redonda 

1.08 

8 775 

Corte ultraideal 

Princesa 

0.51 

1 337 

Corte ideal 

Redonda 

1.02 

4 282 

Corte perfeccionado 

Redonda 

0.51 

1 558 

Corte perfeccionado 

Redonda 

1.02 

6 943 

Corte ideal 

Redonda 

0.45 

1 191 

Corte perfeccionado 

Talla de 58 facetas 

1.01 

7 038 

Buen corte 

Princesa 

0.44 

1 319 

Corte promedio 

Princesa 

1.00 

4 868 

Corte perfeccionado 

Talla de 58 facetas 

0.44 

1 319 

Corte perfeccionado 

Redonda 

0.91 

5 106 

Corte perfeccionado 

Redonda 

0.40 

1 133 

Corte perfeccionado 

Redonda 

0.90 

3 921 

Buen corte 

Redonda 

0.35 

1 354 

Buen corte 

Redonda 

0.90 

3 733 

Corte perfeccionado 

Redonda 

0.32 

896 

Corte perfeccionado 

Redonda 

0.84 

2 621 

Corte perfeccionado 






a) Diseñe un diagrama de caja con la variable de precio y haga algún comentario sobre el resul- 
tado. ¿Hay valores atípicos? ¿Cuál es la mediana del precio? ¿Cuál es el valor del primer y ter- 
cer cuartiles? 

b) Diseñe un diagrama de caja de la variable de tamaño y haga comentarios sobre el resultado. 
¿Hay valores atípicos? ¿Cuál es la mediana del precio? ¿Cuál es el valor del primer y tercer 
cuartiles? 

c) Diseñe un diagrama de dispersión entre ias variables de precio y tamaño. Coloque el precio en 
el eje vertical y el tamaño en el eje horizontal. ¿Le parece que hay alguna relación entre las dos 
variables? ¿La relación es directa o indirecta? ¿Parece que alguno de los puntos es diferente 
de los demás? 

d) Diseñe una tabla de contingencia con las variables de forma y grado de corte. ¿Cuál es el grado 
de corte más común? ¿Cuál es la forma más común? ¿Cuál es la combinación más común de 
grado de corte y forma? 
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38. En la siguiente lista aparece la cantidad de comisiones que ganaron el mes pasado los ocho miem- 
bros del personal de ventas de Best Electronics. Calcule el coeficiente de sesgo utilizando ambos 
métodos. Sugerencia: El uso de una hoja de cálculo agilizará los cálculos. 


980.9 1 036.5 1 099.5 1 153.9 1 409.0 1 456.4 1 718.4 1 721.2 


39. La siguiente tabla contiene la cantidad de robos de automóviles en una ciudad grande la semana 
pasada. Calcule el coeficiente de sesgo utilizando ambos métodos. Sugerencia: El uso de una hoja 
de cálculo agilizará las operaciones. 


3 12 13 7 8 3 8 


40. El gerente de Servicios de Información de Wilkin Investigations, una empresa privada, estudia la 
relación entre el tiempo de uso (en meses) de una máquina compuesta de impresora, copiadora y 
fax, y el costo de mantenimiento mensual de ella. El gerente elaboró el siguiente diagrama sobre 
una muestra de 15 máquinas. ¿Qué puede concluir el gerente sobre la relación entre las variables? 

o $130 

C 
22 

'i 120 

_CD 

| 110 
CD 

15 100 

=3 
en 
cz 

CD 

E 90 

O 
"oo 

3 80 


41. Una compañía de seguros de automóvil arrojó la siguiente información relacionada con la edad de 
un conductor y el número de accidentes registrados el año pasado. Diseñe un diagrama de dis- 
persión con los datos y redacte un breve resumen. 


Edad 

Accidentes 

Edad 

Accidentes 

16 

4 

23 

0 

24 

2 

27 

1 

18 

5 

32 

1 

17 

4 

22 

3 


42. Wendy’s ofrece ocho diferentes condimentos (mostaza, catsup, cebolla, mayonesa, pepinillos, 
lechuga, tomate y guarnición) para hamburguesas. El administrador de una de las tiendas recogió 
la siguiente información relativa al número de condimentos que se pidieron y el grupo de edad de 
los clientes. ¿Qué puede concluir respecto de la información? ¿Quién tiende a ordenar la mayor o 
la menor cantidad de condimentos? 


Cantidad de condimentos 


Edad 


Menos de 18 

De 18 a 40 

De 40 a 60 

60 o mayores 

0 

12 

18 

24 

52 

1 

21 

76 

50 

30 

2 

39 

52 

40 

12 

3 o más 

71 

87 

47 

28 


43. La siguiente lista muestra el número de trabajadores empleados y desempleados de 20 años o 
mayores, de acuerdo con su género en Estados Unidos. 



Meses 
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Número de trabajadores (miles) 

Género 

Empleados 

Desempleados 

Hombres 

70 415 

4 209 

Mujeres 

61 402 

3 314 


a) ¿Cuántos trabajadores se registraron? 

b) ¿Qué porcentaje de trabajadores estaban desempleados? 

c) Compare el porcentaje de desempleados en el caso de hombres y mujeres. 

Ejercicios de lo base de datos 

44 . Consulte los datos Real Estate, que incluyen información sobre las casas vendidas en Goodyear, 

Arizona, el año pasado. Prepare un reporte sobre los precios de venta de las casas. Asegúrese de 

responder en su informe las siguientes preguntas: 

a) Elabore un diagrama de caja. Estime el primer y tercer cuartiles. ¿Hay datos atípicos? 

b) Desarrolle un diagrama de dispersión con el precio en el eje vertical y el tamaño de la casa en 
el horizontal. ¿Le parece que hay alguna relación entre las dos variables? ¿La relación es direc- 
ta o inversa? 

c) Elabore un diagrama de dispersión con el precio en el eje vertical y la distancia al centro de la 
ciudad en el horizontal. ¿Parece que hay alguna relación entre las dos variables? ¿La relación 
es directa o inversa? 

45 . Busque en Baseball 2009 la información sobre los 30 mejores equipos de la Liga Mayor en la tem- 
porada 2009. 

a) Seleccione la variable que se refiere al año en que el estadio fue construido. (Sugerencia: Reste 
el año en el que el estadio se construyó del año actual para determinar la edad del estadio, y 
trabaje con esta variable.) Diseñe un diagrama de caja ¿Hay datos atípicos? 

b) Seleccione la variable relacionada con el salario del equipo y diseñe un diagrama de caja. ¿Hay 
datos atípicos? ¿Cuáles son los cuartiles? Redacte un breve resumen de su análisis. ¿Cómo se 
comparan los salarios de los Yanquis de Nueva York con los otros equipos? 

c) Trace un diagrama de dispersión en cuyo eje vertical se indique el número de juegos ganados 
y el salario del equipo en el eje horizontal. ¿Cuáles son sus conclusiones? 

d) Seleccione la variable juegos ganados. Trace un diagrama de puntos. ¿Qué conclusiones 
puede obtener a partir de esta gráfica? 

46 . Consulte los datos sobre los autobuses que operan en el distrito escolar Buena. 

a) Refiérase a la variable costo de mantenimiento. Desarrolle un diagrama de caja. ¿Cuáles son el 
primer y tercer cuartiles? ¿Hay datos atípicos? 

£>) Determine el costo mediano de mantenimiento. Basándose en la mediana, desarrolle una tabla 
de contingencias en donde el fabricante sea una variable y la otra si el costo de mantenimien- 
to estuvo por arriba o por debajo de la mediana. ¿Cuáles son sus conclusiones? 


Comandos de software 

1 . Los comandos de Minitab para elaborar el diagrama de pun- 
tos de la página 104 son los siguientes: 

a) Introduzca el número de vehículos que recibieron servi- 
cio en Tionesta Ford Lincoln Mercury en la columna C1 
y en Sheffield Motors en C2. Ponga el nombre adecua- 
do a las variables. 

b) Seleccione Graph y Dotplot. En el primer cuadro de diá- 
logo, seleccione Múltiple Y’s Simple en la esquina infe- 
rior izquierda y haga clic en OK. En el siguiente cuadro 
de diálogo, seleccione Tionesta y Sheffield como varia- 
bles para Graph, haga clic en Labels y escriba un título 
adecuado. Haga clic en OK. 

c) Para calcular las estadísticas descriptivas que apare- 
cen en la pantalla, seleccione Stat, Basic statistics 
y, en seguida, Display Descriptive statistics. En el cua- 
dro de diálogo, seleccione Tionesta y Sheffield como 


Variables, haga clic en Statistics, seleccione las esta- 
dísticas que desee obtener y, finalmente, haga doble clic 
en OK. 
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2. Los comandos de Minitab para elaborar el diagrama de tallo 
y hojas de la página 107 son los siguientes: 

a) Importe los datos del sitio web del libro: www.mhhe. 
com/lind15e. El nombre del archivo es Table 4-1. 

b) Seleccione Graph y haga clic en Stem-and-Leaf. 

c) Seleccione la variable Spots, introduzca 10 como Incre- 
ment y haga clic en seguida en OK. 



3. Los comandos de Minitab para elaborar el resumen descrip- 
tivo de la página 113 son los siguientes: 

a) Importe los datos de las comisiones de Smith Barney 
del ejemplo en la página 111. 

b) De la barra de herramientas, seleccione Stat, Basic Sta- 
tistics y Display Descriptive Statistics. En el cuadro de 
diálogo seleccione Commissions como Variable y en 
seguida haga clic en OK. 

4. Los comandos de Excel para elaborar las estadísticas des- 
criptivas de la página 114 son: 

a) Ingrese los datos de las comisiones de Smith Barney del 
ejemplo en la página 111. 

b) En la celda C4 escriba Quartile 1 y en C6 escriba Quar- 
tile 3. 

c) En la celda D4 escriba “ =QUARTILE(A1:A16,1)” y pre- 
sione Enter. En la celda D6 escriba “ =QUARTILE(A1: 
A16,1)” y presione Enter. 

5. Los comandos de Minitab para elaborar el diagrama de caja 
de la página 117 son los siguientes: 


a) Importe los datos de Applewood Auto Group. 

b) Seleccione Graph y en seguida Boxplot. En el cuadro 
de diálogo seleccione Simple en la esquina superior 
izquierda y haga clic en OK. Seleccione Age como 
Graph variable, haga clic en Labels, incluya un encabe- 
zado adecuado y haga clic en OK. 



6. Los comandos de Minitab para construir el resumen des- 
criptivo de la página 122 son los siguientes: 

a) Ingrese los datos en la primera columna. En la celda de 
debajo de C1, ingrese la variable Earnings. 

b) Seleccione Stat, Basic Statistics y haga clic en Graphi- 
cal Summary. Seleccione Earnings como variable y 
haga clic en OK. 

7. Los comandos de Excel para dibujar el diagrama de disper- 
sión de la página 125 son los siguientes: 

a) Recupere los datos de Applewood Auto Group. 

b) Resalte con el mouse la columna de edad y la de ganan- 
cia. Incluya la primera fila. 

c) Seleccione la pestaña Inserí. Seleccione Scatter en las 
opciones de Chart. Seleccione Chart Title y escriba un 
nombre para el diagrama. Después, bajo la misma pes- 
taña Layout, seleccione AxisTitles. En Primary Vertical 
Axis Title, escriba Profit como el nombre del eje. En Pri- 
mary Horizontal Axis Title, escriba Age como el nom- 
bre del eje. Seleccione Legend y elija None. 


Capítulo 4 


Respuestas a las autoevaluaciones 



4-1 1. a) 79, 105 

b ) 15 

c) De 88 a 97; 75% de las tiendas se encuentran en 
este rango. 


b) Q-, = 7.76, Q 3 = 8.015 

4-3 El valor más bajo es 10 y el más alto 85; el primer cuartil 
es 25 y el tercero 60. Alrededor de 50% de los valores se 
encuentran entre 25 y 60. El valor de la mediana es de 
40. La distribución es positivamente sesgada. 


7 

7 

8 

0013488 

9 

1256689 

10 

1248 

11 

26 


a) 8 

b) 10.1, 10.2, 10.4, 10.8 

c) 9.5 

d) 11.6, 7.7 


Glosario 


137 


- 407 

4-4 a) X = = 81 .4, mediana = 84 

5 


s = 


923.2 


1 


= 15.19 


b) sk 


3(81.4 - 84.0) 
15.19 


-0.51 


X 

X X 

X - X 

3 

S 

S 

73 

-0.5530 

-0.1691 


98 

1.0928 

1.3051 


60 

-1.4088 

-2.7962 

92 

0.6978 

0.3398 

84 

0.1712 

0.0050 



-1.3154 


sk 


5 

(4X3) 


[-1.3154] 


= -0.5481 


d) La distribución es de alguna forma negativamente ses- 
gada. 

4-5 a) Diagrama de dispersión 

b) 16 

c) $7 500 

d) Fuerte y directa 


Repaso de los capítulos 1-4 

Esta sección constituye un repaso de los conceptos y términos más importantes que estructuran los 
capítulos 1 a 4. El capítulo 1 se inició con una descripción del significado y objetivo de la estadística. 
En seguida se describieron los diferentes tipos de variables y los cuatro niveles de medición. El capí- 
tulo 2 se centró en la descripción de un conjunto de observaciones y la forma en la que se organiza- 
ban en una distribución de frecuencias y en la representación de la distribución de frecuencias como 
un histograma o un polígono de frecuencias. El capítulo 3 comenzó con la descripción de medidas de 
ubicación, como la media, la media ponderada, la mediana, la media geométrica y la moda. Este capí- 
tulo también incluyó las medidas de dispersión o propagación. En esta sección se estudiaron el rango, 
la desviación media, la varianza y la desviación estándar. El capítulo 4 incluyó diversas técnicas de gra- 
ficación, como los diagramas de puntos, los diagramas de caja y los diagramas de dispersión. También 
el coeficiente de sesgo, que indica la falta de simetría que puede existir en un conjunto de datos. 

A lo largo de esta sección se destacó la importancia del software estadístico, como Excel y 
Minitab. En estos capítulos muchas capturas de pantalla demostraron la rapidez y eficacia con la que 
se puede organizar un conjunto de datos en una distribución de frecuencias; mostraron, asimismo, el 
cálculo de diversas medidas de ubicación o de variación y la información que se presenta de forma grá- 
fica. 


Glosario 


Capítulo 1 

Estadística Ciencia encargada de recolectar, organizar, anali- 
zar e interpretar datos numéricos con el fin de que se tomen 
decisiones más efectivas. 

Estadística descriptiva Técnicas que se emplean para descri- 
bir las características importantes de un conjunto de datos. Éstos 
pueden incluir la organización de los valores en una distribución 
de frecuencias y el cálculo debería ser de ubicación, de disper- 
sión y sesgos. 

Estadística inferencial, también denominada inferencia esta- 
dística Esta faceta de la estadística se relaciona con el cálculo 
de un parámetro basado en la estadística de una muestra. Por 
ejemplo, si 2 calculadoras de mano de una muestra de 10 calcu- 
ladoras son defectuosas, podemos inferir que 20% de la produc- 
ción es defectuosa. 


Medida de intervalo Si una observación es mayor que otra por 
una cierta cantidad, y el punto cero es arbitario, la medición 
corresponde a una escala de intervalo. Por ejemplo, la diferencia 
entre las temperaturas de 70 y 80 grados es de 10 grados. 
Asimismo, una temperatura de 90 grados es 10 grados más alta 
que una temperatura de 80 grados, y así sucesivamente. 

Medida de razón Si las distancias entre números son de cier- 
to tamaño constante conocido y existe un punto cero real, ade- 
más de que la razón entre dos valores es significativa, la medida 
es de escala de razón. Por ejemplo, la distancia entre $200 y 
$300 es $100, y en el caso del dinero, existe un punto cero real. 
Si se tienen cero dólares, no hay dinero (no se tiene nada). 
Asimismo, la razón entre $200 y $300 es significativa. 

Medida nominal Nivel de medición más bajo. Si los datos se 
clasifican en categorías y el orden de dichas categorías no es 


138 


CAPÍTULO 4 Descripción de datos: presentación y análisis de datos 


importante, se trata del nivel nominal de medición. Ejemplos de 
éste son el género (hombre, mujer) y la afiliación política (republi- 
cano, demócrata, independiente, todos los demás). Si no hay 
diferencia entre listar primero a un hombre que a una mujer, los 
datos son de nivel nominal. 

Medida ordinal Los datos pueden ser ordenados lógicamente 
refiriéndose a un orden. Por ejemplo, la respuesta del consumi- 
dor al sonido de una nueva bocina puede ser: excelente, muy 
buena, regular o pobre. 

Muestra Porción, o subconjunto, de la población que se estudia. 
Población Colección o conjunto de individuos, objetos o medi- 
das cuyas propiedades se estudian. 

Capítulo 2 

Clase Intervalo en el que se recopilan los datos. Por ejemplo, 
$4 a $7 constituye una clase; $7 a $1 1 es otra. 

Distribución de frecuencias Agrupación de datos en clases 
que muestra el número de observaciones en cada una de las cla- 
ses mutuamente excluyentes. Por ejemplo, los datos se organi- 
zan en clases como las siguientes: de $1 000 a $2 000; de $2 000 
a $3 000, y así sucesivamente, con el fin de resumir la informa- 
ción. 

Distribución de frecuencias relativas Distribución de frecuen- 
cias que muestra la fracción o parte del total de observaciones 
de cada clase. 

Exhaustivo Cada observación debe caer en alguna de las cate- 
gorías. 

Frecuencia de clase Número de observaciones de cada clase. 
Si se realizan 16 observaciones de la clase de $4 a $6, 16 es la 
frecuencia de clase. 

Gráficas Formatos especiales de representación que se utili- 
zan para mostrar una distribución de frecuencias, incluyendo his- 
togramas, polígonos de frecuencias y polígonos de frecuencias 
acumulativas. Otros dispositivos gráficos que se emplean para 
representar datos son las gráficas de líneas, las gráficas de 
barras y las gráficas de pastel. 

Histograma Representación gráfica de una frecuencia o una 
distribución de frecuencias relativas. El eje horizontal muestra las 
clases. La altura vertical de barras adyacentes muestra la fre- 
cuencia o frecuencia relativa de cada clase. 

Mutuamente excluyente Propiedad de un conjunto de catego- 
rías que permite incluir a un individuo, objeto o medida en una 
sola categoría. 

Punto medio Valor que divide a la clase en dos partes iguales. 
En las clases que van de $10 a $20 y de $20 a $30, los puntos 
medios son $15 y $25, respectivamente. 

Capítulo 3 

Desviación estándar Raíz cuadrada de la varianza. 
Desviación media Media de las desviaciones de la media, sin 
tomar en cuenta los signos. Se abrevia DM. 

Media aritmética Suma de valores dividida entre el número de 
valores. El símbolo de la media de una muestra es X, y el símbo- 
lo de una media poblacional es pt. 

Media geométrica Enésima raíz del producto de los valores. 
Es de particular utilidad para promediar razones de cambio y 
números indicadores. Minimiza la importancia de los valores 
extremos. Una segunda aplicación de la media geométrica se 
relaciona con determinar el cambio porcentual anual medio 
durante cierto periodo. Por ejemplo, si las ventas brutas fueron 
de $245 millones en 1990 y de $692 millones en 2010, el incre- 
mento porcentual anual promedio es 5.33. 

Media ponderada Cada valor se pondera de acuerdo con su 
importancia relativa. Por ejemplo, si 5 camisas cuestan $10 cada 


una, y 20 cuestan $8 cada una, el precio medio ponderado es de 
$8.40: [(5 X $10) + (20 X $8)]/25 = $210/25 = $8.40. 

Mediana Valor de la observación media después de que todas 
las observaciones se ordenaron de menor a mayor. Por ejemplo, 
si las observaciones 6, 9 y 4 se ordenan 4, 6 y 9, la mediana es 
6, el valor medio. 

Medida de dispersión Valor que muestra la propagación de los 
datos. El rango, la varianza y la desviación estándar son medidas 
de dispersión. 

Medida de ubicación Número que indica un solo valor típico 
de los datos. Señala al centro de una distribución. La media arit- 
mética, la media ponderada, la mediana, la moda y la media geo- 
métrica son medidas de ubicación central. 

Moda Valor que se presenta con mayor frecuencia en un con- 
junto de datos. En el caso de datos agrupados, es el punto 
medio de la clase que contiene el máximo número de valores. 
Rango Medida de dispersión calculada como el valor máximo 
menos el valor mínimo. 

Varianza. Medida de dispersión respecto de la media aritméti- 
ca basada en las diferencias promedios elevadas al cuadrado. 


Capítulo 4 

Coeficiente de sesgo Medida de la falta de simetría de una 
distribución. En el caso de una distribución simétrica, no existe 
sesgo, así que el coeficiente de sesgo es cero. De lo contrario, 
puede ser positivo o negativo, con límites ±3.0. 

Cuartiles Valores de un conjunto de datos ordenados (de míni- 
mo a máximo) que dividen los datos en cuatro intervalos de fre- 
cuencias aproximadamente iguales. 

Dato atípico Dato que suele estar muy lejos de los otros. Una 
regla aceptada es clasificar una observación como dato atípico 
si el rango intercuartil está 1 .5 veces por encima del tercer cuar- 
til o por debajo del primer cuartil. 

Deciles Valores de un conjunto de datos ordenados (de mínimo 
a máximo), que dividen los datos en diez intervalos de frecuen- 
cias aproximadamente iguales. 

Diagrama de caja Representación gráfica que muestra la 
forma general de la distribución de una variable. Se basa en 
cinco estadísticos descriptivos: los valores máximo y mínimo, el 
primer y tercer cuartiles y la mediana. 

Diagrama de dispersión Técnica gráfica que se emplea para 
mostrar la relación entre dos variables medidas con escalas de 
intervalo o de razón. 

Diagrama de puntos Flerramienta de investigación que resu- 
me la distribución de una variable apilando los puntos sobre una 
línea de puntos que muestra los valores de la variable. Un diagra- 
ma de puntos utiliza todos los valores. 

Diagrama de tallo y hojas Método para representar la distribu- 
ción de una variable utilizando todos los valores. Los valores son 
clasificados por el dígito principal de los datos. Por ejemplo, si un 
conjunto de datos contiene valores entre 13 y 84, se utilizarían 
para los tallos ocho clases basadas en los dígitos de las dece- 
nas. Las unidades corresponderían a las hojas. 

Percentiles Valores de un conjunto de datos ordenados (de 
mínimo a máximo) que dividen los datos en cien intervalos de fre- 
cuencias aproximadamente iguales. 

Rango intercuartil Valor absoluto de la diferencia numérica 
entre el primer y tercer cuartiles. Cincuenta por ciento de los 
valores de una distribución se presentan en este rango. 

Tabla de contingencia Tabla que se utiliza para clasificar ob- 
servaciones de acuerdo con dos o más características nomina- 
les. 


Problemas 
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Problemas 


1. Una muestra de fondos depositados en la cuenta de cheques miniatura del First Federal Savings 
Bank, reveló las siguientes cantidades: 


$124 

$14 

$150 

$289 

$52 

$156 

$203 

$82 

$27 

$248 

39 

52 

103 

58 

136 

249 

110 

298 

251 

157 

186 

107 

142 

185 

75 

202 

119 

219 

156 

78 

116 

152 

206 

117 

52 

299 

58 

153 

219 

148 

145 

187 

165 

147 

158 

146 

185 

186 

149 

140 


Utilice un paquete de software estadístico como Excel o Minitab para ayudarse a contestar las 
siguientes preguntas. 

a) Determine la media, la mediana y la desviación estándar. 

£>) Determine el primer y tercer cuartiles. 

c) Desarrolle un diagrama de puntos. ¿Flay datos atípicos? ¿Las cantidades siguen una distribu- 
ción simétrica o están sesgadas? Sustente su respuesta. 

d) Organice la distribución de fondos en una distribución de frecuencia. 

e) Redacte un breve resumen de los resultados que obtuvo en los incisos a) a d). m 

2. A continuación se presenta una lista de los 44 presidentes de Estados Unidos y sus edades cuan- 
do comenzaron sus respectivos periodos. 


Número 

Nombre 

Edad 

Número 

Nombre 

Edad 

1 

Washington 

57 

23 

B. Harrison 

55 

2 

J. Adams 

61 

24 

Cleveland 

55 

3 

Jefferson 

57 

25 

McKinley 

54 

4 

Madison 

57 

26 

T. Roosevelt 

42 

5 

Monroe 

58 

27 

Taft 

51 

6 

J.Q. Adams 

57 

28 

Wilson 

56 

7 

Jackson 

61 

29 

Harding 

55 

8 

Van Burén 

54 

30 

Coolidge 

51 

9 

W.H. Harrison 

68 

31 

Hoover 

54 

10 

Tyler 

51 

32 

F.D. Roosevelt 

51 

11 

Polk 

49 

33 

Truman 

60 

12 

Taylor 

64 

34 

Eisenhower 

62 

13 

Fillmore 

50 

35 

Kennedy 

43 

14 

Pierce 

48 

36 

L.B. Johnson 

55 

15 

Buchanan 

65 

37 

Nixon 

56 

16 

Lincoln 

52 

38 

Ford 

61 

17 

A. Johnson 

56 

39 

Cárter 

52 

18 

Grant 

46 

40 

Reagan 

69 

19 

Hayes 

54 

41 

G.H.W. Bush 

64 

20 

Garfield 

49 

42 

Clinton 

46 

21 

Arthur 

50 

43 

G.W. Bush 

54 

22 

Cleveland 

47 

44 

Obama 

47 


Utilice un paquete de software estadístico como Excel o Minitab para ayudarse a contestar las 
siguientes preguntas. 

a) Determine la media, la mediana y la desviación estándar. 

b) Determine el primer y tercer cuartiles. 

c) Desarrolle un diagrama de puntos. ¿Hay datos atípicos? ¿Las cantidades siguen una distribu- 
ción simétrica o están sesgadas? Sustente su respuesta. 

d) Organice la distribución de fondos en una distribución de frecuencia. 

e) Redacte un breve resumen de los resultados que obtuvo en los incisos a) a d). m 
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3. Se enlista a continuación el ingreso per cápita de los 50 estados y el Distrito de Columbia. 


Estado 

Cantidad 

Estado 

Cantidad 

Alabama 

$30 894 

Montana 

$30 790 

Alaska 

38 138 

Nebraska 

34 440 

Arizona 

31 936 

Nevada 

38 994 

Arkansas 

28 473 

New Hampshire 

39 753 

California 

39 626 

New Jersey 

46 763 

Colorado 

39 491 

New México 

29 929 

Connecticut 

50 762 

New York 

44 027 

Delaware 

39 131 

North Carolina 

32 247 

DC 

57 746 

North Dakota 

32 763 

Florida 

36 720 

Ohio 

33 320 

Georgia 

32 095 

Oklahoma 

32 391 

Hawaii 

37 023 

Oregon 

33 299 

Idaho 

29 920 

Pennsylvania 

36 825 

Illinois 

38 409 

Rhode Island 

37 523 

Indiana 

32 288 

South Carolina 

29 767 

lowa 

33 038 

South Dakota 

32 030 

Kansas 

34 799 

Tennessee 

32 172 

Kentucky 

29 729 

Texas 

35 166 

Louisiana 

31 821 

Utah 

29 406 

Maine 

32 095 

Vermont 

34 871 

Maryland 

43 788 

Virginia 

39 540 

Massachusetts 

46 299 

Washington 

38 212 

Michigan 

33 788 

West Virginia 

28 206 

Minnesota 

38 859 

Wisconsin 

34 405 

Mississippi 

27 028 

Wyoming 

40 655 

Missouri 

32 789 




Utilice un paquete de software estadístico como Excel o Minitab para ayudarse a contestar ias 
siguientes preguntas. 

a) Determine la media, la mediana y la desviación estándar. 

b) Determine el primer y tercer cuartiles. 

c) Desarrolle un diagrama de puntos. ¿Hay datos atípicos? ¿Las cantidades siguen una distribu- 
ción simétrica o están sesgadas? Sustente su respuesta. 

d) Organice la distribución de fondos en una distribución de frecuencia. 

e) Redacte un breve resumen de los resultados que obtuvo en ios incisos a) a d). 

4. Una muestra de 12 casas que se vendieron la semana pasada en St. Paul, Minnesota, reveló la 
siguiente información. Trace un diagrama de dispersión. ¿Es posible concluir que, conforme las 
dimensiones (expresadas en miles de pies cuadrados) de la casa aumentan, el precio de venta (en 
miles de dólares) también se incrementa? 


Dimensiones de 
la casa (miles de 
pies cuadrados) 

Precio de venta 
(miles de dólares) 

1.4 

100 

1.3 

110 

1.2 

105 

1.1 

120 

1.4 

80 

1.0 

105 


Dimensiones de 
la casa (miles de 
pies cuadrados) 

Precio de venta 
(miles de dólares) 

1.3 

110 

0.8 

85 

1.2 

105 

0.9 

75 

1.1 

70 

1.1 

95 


Casos 
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5. Consulte el siguiente diagrama: 


0 40 80 120 160 200 


a) ¿Cuál es el nombre de la gráfica? 

b) ¿Cuál es la mediana y los valores del primer y tercer cuartiles? 

c) ¿Es la distribución positivamente sesgada? Indique cómo lo sabe. 

d) ¿Hay datos atípicos? Si es el caso, estime los valores. 

e) ¿Puede determinar el número de observaciones en el estudio? 


Casos 


A. Century Nacional Bank 

El siguiente caso aparecerá en las subsecuentes secciones de 
repaso. Suponga que usted trabaja en el Departamento de Pla- 
neación del Century National Bank y le reporta a la señora Lam- 
berg. Usted necesita hacer un análisis de datos y preparar un 
breve informe escrito. Recuerde que el señor Selig es el presi- 
dente del banco, de modo que usted querrá asegurarse de que 
su informe sea completo y exacto. El apéndice A. 6 contiene una 
copia de los datos. 

Century National Bank cuenta con oficinas en diversas ciu- 
dades de la región central y el sureste de Estados Unidos. Al 
señor Dan Selig, presidente y director ejecutivo, le gustaría cono- 
cer las características de sus clientes con cuentas de cheques. 
¿Cuál es el saldo de un cliente típico? 

¿Cuántos servicios bancarios más utilizan los clientes con 
cuentas de cheques? ¿Utilizan los clientes el servicio de cajero 
automático y, de ser así, cuán a menudo? ¿Qué hay de las tarje- 
tas de débito? ¿Quién las utiliza y con cuánta frecuencia? 

Para comprender mejor a los clientes, el señor Selig pidió a 
la señora Wendy Lamberg, directora de planeación, que selec- 
cionara una muestra de clientes y preparara un informe. Para 
comenzar, ella ha nombrado un equipo de entre su personal. 
Usted es el jefe del equipo y el responsable de elaborar el infor- 
me. Elige una muestra aleatoria de 60 clientes. Además del saldo 
de cada cuenta al final del mes pasado, usted determina lo 
siguiente: 1) el número de transacciones en cajeros automáticos 
del mes pasado; 2) el número de servicios bancarios distintos 
(cuenta de ahorro, certificados de depósito, etc.) que utiliza el 
cliente; 3) si el cliente posee una tarjeta de débito (éste es un ser- 
vicio bancario relativamente nuevo respecto del cual los cargos 
se hacen directamente a la cuenta del cliente); 4) si se paga o no 
interés en la cuenta de cheques. La muestra incluye clientes de 
las sucursales en Cincinnati, Ohio; Atlanta, Georgia; Louisville, 
Kentucky, y Erie, Pennsylvania. 

1. Diseñe una gráfica o tabla que represente los saldos de las 
cuentas de cheques. ¿Cuál es el saldo de un cliente típico? 
¿Hay clientes con más de $2 000 en sus cuentas? ¿Le parece 
que existe una diferencia en la distribución de las cuentas 
entre las cuatro sucursales? ¿En torno a qué valor tienden a 
acumularse los saldos? 

2. Determine la media y la mediana de los saldos de las cuentas 
de cheques. Compare la media y la mediana de los saldos de 


las cuatro sucursales. ¿Existe alguna diferencia entre las 
sucursales? Explique en su informe la diferencia entre la media 
y la mediana. 

3. Determine el rango y la desviación estándar de los saldos de 
las cuentas de cheques. ¿Qué muestran el primer y tercer 
cuartiles? Determine el coeficiente de sesgo e indique lo que 
muestra. Como el señor Selig no maneja estadísticas diaria- 
mente, incluya una breve descripción e interpretación de la 
desviación estándar y de otras medidas. 

B. Wildcat Plumbing Supply, Inc.: ¿hay diferencias 
de género? 

Wildcat Plumbing Supply ha dado servicios de plomería en el sur 
de Arizona por más de 40 años. La compañía, que fue fundada 
por el señor Terrence St. Julián y hoy la dirige su hijo Cory, ha cre- 
cido de un puñado de empleados a más de 500. Cory está inte- 
resado en los diferentes puestos en la compañía en los que tra- 
bajan hombres y mujeres que llevan a cabo las mismas tareas, 
pero con diferente salario. Para investigar, recoge la información 
que sigue. Suponga que usted es un estudiante que lleva a cabo 
prácticas en el departamento de contabilidad y que se le ha en- 
comendado la tarea de redactar un Informe que resuma la situa- 
ción. 


Salario anual 
(miles de dólares) 

Mujeres 

Hombres 

Menos de 30 

2 

0 

30 a 40 

3 

1 

40 a 50 

17 

4 

50 a 60 

17 

24 

60 a 70 

8 

21 

70 a 80 

3 

7 

80 o más 

0 

3 


Para arrancar el proyecto, el señor Cory St. Julián organizó 
una junta con su personal, a la cual usted fue invitado. En esta 
junta se sugirió que usted calculara diversas medidas de ubica- 
ción, que trazara diagramas, como una distribución de frecuen- 
cias acumulativas y que determinara los cuartiles tanto de hom- 
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bres como de mujeres. Elabore los diagramas y redacte un infor- 
me que resuma los salarios anuales de los empleados de Wildcat 
Plumbing Supply. ¿Parece que hay diferencias de pago a partir 
del género? 

C. Kimble Products: ¿hay alguna diferencia 
en el pago de comisiones? 

En la junta nacional de ventas de enero, al director ejecutivo de 
Kimble Products se le cuestionó sobre la política de la compañía 
en lo que se refiere al pago de comisiones a sus representantes 
de ventas. La compañía vende artículos deportivos en dos mer- 
cados importantes. Tiene 40 representantes de ventas que se 


Comisiones que obtuvieron los representantes de ventas 
que atienden departamentos de deportes ($) 

354 87 1 676 1 187 69 3 202 680 39 1 683 1 106 

883 3 140 299 2 197 175 159 1 105 434 615 149 

1 168 278 579 7 357 252 1 602 2 321 4 392 

416 427 1 738 526 13 1 604 249 557 635 527 


comunican directamente con una gran cantidad de clientes, 
como los departamentos de educación física de los principales 
institutos, universidades y franquicias de artículos deportivos 
profesionales. Además, 30 agentes de ventas representan a la 
compañía ante tiendas de menudeo ubicadas en centros comer- 
ciales y grandes almacenes de descuento, como Kmart y Target. 

Al llegar a las oficinas centrales, el director ejecutivo solicitó 
al gerente de ventas un informe en el que se compararan las 
comisiones que ganaron el año pasado las dos secciones del 
equipo de ventas. ¿Concluiría usted que existe alguna diferen- 
cia? En el informe incluya información sobre la tendencia central, 
así como sobre la dispersión en los dos grupos. 


Comisiones que obtuvieron los representantes de ventas 
que atienden grandes tiendas de menudeo ($) 

1 116 681 1 294 12 754 1 206 1 448 870 944 1 255 

1 213 1 291 719 934 1 313 1 083 899 850 886 1 556 

886 1 315 1 858 1 262 1 338 1 066 807 1 244 758 918 


Test de práctica 

Existe un cuestionario de práctica al final de cada sección de revisión, que consta de dos partes. La primera contiene diversas pre- 
guntas objetivas, por lo general con un espacio en blanco para la respuesta. La segunda consiste en problemas y ejercicios. En la 
mayoría de los casos, debería tomarle de 30 a 45 minutos completar el test. Los problemas requieren de una calculadora. Verifique 
las soluciones en la Sección de respuestas en la parte final del libro. 

Parte 1: Preguntas objetivas 

1. La ciencia de recolectar, organizar, presentar, analizar e interpretar los datos para ayudar a tomar decisiones eficaces se llama 

1 

2. Los métodos para organizar, resumir y presentar los datos de una manera informativa se llaman 

2 

3. El grupo completo de individuos u objetos de interés, o las medidas que se obtienen de todos los individuos u objetos de inte- 
rés se llama 3. 

4. Mencione dos tipos de variables. 4. 


5. El número de habitaciones en una casa es un ejemplo de variable (discreta, continua, cualitativa: elija una) 

5 

6. Los números en los jerseys de los jugadores de las Ligas Mayores de Béisbol, ¿son un ejemplo de qué nivel de medición? 


6 

7. ¿Qué ejemplo de nivel de medición sería la clasificación de estudiantes por color de ojos? 7 

8. ¿A qué valor equivale siempre la suma de las diferencias entre cada valor y la media? 8 

9. Un grupo de datos contiene 70 observaciones. ¿Cuántas clases sugeriría usted para construir una distribución de frecuencias? 

9 

10. ¿Qué porcentaje de los valores en un grupo de datos es siempre más grande que la mediana? 10. 

11. El cuadrado de la desviación estándar es la . 11 

12. La desviación estándar asume un valor negativo cuando (Todos los valores son negativos, al menos la mitad de los 

valores son negativos, o nunca: elija una.) 12 

13. ¿Cuál de los siguientes es el menos afectado por un dato atípico? (media, mediana o rango: elija una) 13 

Parte 2: Ejercicios 


1. El índice de precios de valores Russell 2000 se incrementó en las siguientes cantidades los últimos tres años. 



¿Cuál es la media geométrica del incremento de los tres años? 


Test de práctica 
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2. La siguiente información se refiere a los precios de venta, en miles de dólares, de casas que se vendieron en Warren, PA, duran- 
te 2010. 


Precio de venta 
(miles de dólares) 

Frecuencia 

120.0 a 150.0 

4 

150.0 a 180.0 

18 

180.0 a 210.0 

30 

210.0 a 240.0 

20 

240.0 a 270.0 

17 

270.0 a 300.0 

10 

300.0 a 330.0 

6 


a) ¿Cuál es el intervalo de clase? 

b) ¿Cuántas casas se vendieron en 2010? 

c) ¿Cuántas casas se vendieron en menos de $210 000? 

cf) ¿Cuál es la frecuencia relativa de la clase 210 a 240? 

e) ¿Cuál es el punto medio de la clase 150 a 180? 

f) ¿Entre cuáles dos cantidades está el rango de los precios de venta? 

3. Una muestra de ocho estudiantes universitarios reveló que poseían el siguiente número de discos compactos. 


52 

76 

64 

79 

80 

74 

66 

69 


a) ¿Cuál es el número medio de discos compactos? 

b) ¿Cuál es el número mediano de discos compactos? 

c) ¿Cuál es el cuadragésimo percentil? 

d) ¿Cuál es el rango del número de discos compactos? 

e) ¿Cuál es la desviación estándar del número de discos compactos? 

4. Un inversionista compró 200 acciones de Blair Company a 36 dólares cada una en julio de 201 0, 300 acciones a 40 dólares cada 
una en septiembre de 2010, y 500 acciones a 50 dólares cada una en enero de 201 1 . ¿Cuál es la media ponderada de este inver- 
sionista del precio por acción? 

5. Durante el Súper Tazón 2008 se consumieron 30 millones de libras de comida chatarra. La siguiente gráfica presenta esta infor- 
mación. 



a) ¿Cuál es el nombre que se le da a esta gráfica? 

b) Estime, en millones de libras, la cantidad de papas fritas consumidas durante el juego. 

c) Estime la relación entre las papas fritas y las palomitas. (El doble, la mitad, el triple, ninguna de las anteriores: 

elija una.) 

d) ¿Qué porcentaje del total comprenden las papas fritas y los nachos? 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Explicar los términos 
experimento, evento y 
resultado. 

OA2 Identificar y aplicar el 
enfoque adecuado para 
asignar probabilidades. 

OA3 Calcular probabilidades 
mediante las reglas de la 
adición. 

OA4 Definir el término 
probabilidad conjunta. 

OA5 Calcular probabilidades 
mediante las reglas de la 
multiplicación. 

OA6 Definir el término 
probabilidad condicional. 

OA7 Calcular probabilidades 
por medio de una tabla de 
contingencias. 

OA8 Calcular probabilidades 
con base en el teorema de 
Bayes. 

OA9 Determinare! número 
de resultados por medio del 
principio apropiado de conteo. 



r 

Estudio de los 
conceptos de la 
probabilidad 



Se descubrió que 60% de los turistas que fueron a China visitaron la 
Ciudad Prohibida, el Templo del Cielo, la Gran Muralla y otros sitios 
históricos dentro o cerca de Beijing. Cuarenta por ciento de ellos 
visitaron Xi’an y sus magníficos soldados, caballos y carrozas de 
terracota, que yacen enterrados desde hace 2 000 años. Treinta por 
ciento de los turistas fueron tanto a Beijing como a Xi’an. ¿Cuál es la 
probabilidad de que un turista haya visitado por lo menos uno de estos 
lugares? (Vea el ejercicio 76, objetivo 4.) 


5.1 Introducción 
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5.1 Introducción 

Los capítulos 2, 3 y 4 se enfocan en la estadística descriptiva. En el capítulo 2 se organizaron 
las ganancias de 180 vehículos que vendió el Applewood Auto Group en una distribución de 
frecuencias, que muestra las ganancias más baja y más alta y el punto donde se presenta la 
concentración de datos. En el capítulo 3, mediante medidas numéricas de ubicación y disper- 
sión, se definió una ganancia típica y se examinó la variación de la ganancia derivada de una 
venta. Se describió la variación de las ganancias con medidas de dispersión como el rango y 
la desviación estándar. En el capítulo 4 se diseñaron diagramas y gráficas, tales como el dia- 
grama de dispersión, con el fin de presentar los datos de manera gráfica. 

A la estadística descriptiva le concierne el resumen de datos recogidos de eventos pasa- 
dos. Ahora se presenta la segunda faceta de la estadística, a saber, el cálculo de la probabili- 
dad de que algo ocurra en el futuro. Esta faceta de la estadística recibe el nombre de inferen- 
cia estadística o estadística inferencial. 

Quien toma decisiones, pocas veces cuenta con la información completa para hacerlo. 
Por ejemplo: 


• Toys and Things, un fabricante de juguetes y 
rompecabezas, creó un nuevo juego basado en 
una trivia deportiva. Pretende saber si los faná- 
ticos del deporte comprarán el juego. Slam 
Dunk y Home Run son dos de los nombres que 
se consideran. Una forma de reducir al mínimo 
el riesgo de tomar una decisión incorrecta con- 
siste en contratar a una empresa de investiga- 
ción de mercado para que tome una muestra 
de, por ejemplo, 2 000 consumidores de la po- 
blación y pregunte a cada entrevistado su opi- 
nión del nuevo juego y los nombres que pro- 
pone. De acuerdo con los resultados de la muestra, la compañía calculará la proporción 
de la población que comprará el juego. 

• El departamento de control de calidad de la fundidora Bethlehem Steel debe asegurar a 
la administración que el cable de un cuarto de pulgada que se fabrica tiene una fuerza de 
tensión aceptable. Es obvio que no se prueba la fuerza de tensión de todo el cable que se 
fabrica, ya que la prueba requiere que el cable se tense hasta que se rompa, es decir, lo 
destruye. De modo que se selecciona una muestra de 1 0 piezas y se prueban. A partir de 
los resultados del estudio, todo el cable que se fabrica se califica de aceptable o inacep- 
table. 

• Otras preguntas que Implican incertidumbre son: ¿debe suspenderse de inmediato la tele- 
novela Days of Our Uves? ¿Será redituable un nuevo cereal con sabor a menta si se 
comercializa? ¿Charles Linden será elegido auditor del condado en Batavia County? 

La inferencia estadística se relaciona con las conclusiones relacionadas con una pobla- 
ción sobre la base de una muestra que se toma de ella. (Las poblaciones de los ejemplos ante- 
riores son: todos los consumidores aficionados a las trlvias deportivas; todos los cables de 
acero de un cuarto de pulgada; todos los televidentes que ven telenovelas; toda la gente que 
compra cereal para el desayuno, etcétera.) 

Dada la incertidumbre existente en la toma de decisiones, es importante que se evalúen 
científicamente todos los riesgos implicados. La teoría de la probabilidad, a menudo conoci- 
da como la ciencia de la incertidumbre, resulta útil para hacer esta evaluación. Su aplicación 
permite a quien toma decisiones y posee información limitada analizar los riesgos y reducir al 
mínimo el riesgo que existe, por ejemplo, al lanzar al mercado un nuevo producto o aceptar un 
envío que quizá contenga partes defectuosas. 

Puesto que los conceptos de la probabilidad son importantes en el campo de la inferen- 
cia estadística (tema que se analiza en el capítulo 8), en este capítulo se Introduce el lenguaje 
básico de la probabilidad, que incluye términos como experimento, evento, probabilidad sub- 
jetiva y reglas de la adición y de la multiplicación. 
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CAPÍTULO 5 Estudio de los conceptos de la probabilidad 


OA1 Explicar los términos 
experimento, evento y 
resultado. 


5.2 / Qué es la probabilidad? 

Sin duda usted se encuentra familiarizado con términos como probabilidad, azar y posibilidad. 
Con frecuencia se les emplea de manera indistinta. El meteorólogo anuncia que hay 70% de 
probabilidad de lluvia para el domingo del Súper Tazón. Con base en una encuesta de consu- 
midores que degustaron un pepinillo recién elaborado con sabor a plátano, la probabilidad de 
que sea un éxito financiero si se le comercializa es de 0.03. (Esto significa que la probabilidad 
de que el pepinillo sabor a plátano sea aceptado por el público es muy remota.) ¿Qué es la 
probabilidad? En general es un número que describe la posibilidad de que algo suceda. 


PROBABILIDAD Valor entre cero y uno, inclusive, que describe la posibilidad relativa (oportuni- 
dad o casualidad) de que ocurra un evento. 


Es común que una probabilidad sea expresada en forma decimal, como 0.70, 0.27 o 0.50. 
No obstante, también se da en forma de fracción, como 7/10, 27/100 o 1/2. Se puede supo- 
ner cualquier número de 0 a 1 , inclusive. Si una compañía sólo tiene cinco regiones de ventas, 
y el nombre o número de cada reglón se escribe en un trozo de papel, que se coloca en un 
sombrero, la probabilidad de seleccionar una de las cinco regiones es de 1. La probabilidad 
de sacar del sombrero un trozo de papel rotulado con “Pittsburgh Steelers” es 0. Por consi- 
guiente, la probabilidad de 1 representa algo que seguramente sucederá, y la probabilidad de 
0 representa algo que no sucederá. 

Cuanto más próxima se encuentre una probabilidad a 0, más improbable es que el even- 
to suceda. Cuanto más próxima se encuentre la probabilidad a 1 , más seguro es que suceda. 
El siguiente diagrama muestra la relación e Incluye algunas conjeturas personales. Sin embar- 
go, usted podría seleccionar una probabilidad distinta de que Slo Poke gane el Derby de 
Kentucky o de que se incrementen los impuestos federales. 


No 

sucederá 




Con seguridad 
sucederá 


1 1 

i ! 

1 1 

1 
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Sol 

de ganar 

en un solo 

los impuestos 

este año 

desaparezca 
este año 

el Derby 
de Kentucky 

lanzamiento 
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federales 



En el estudio de la probabilidad se utilizan tres palabras clave: experimento, resultado y 
evento. Dichos términos son empleados en el lenguaje de la vida cotidiana, pero en estadís- 
tica adquieren significados específicos. 


EXPERIMENTO Proceso que induce a que ocurra una y sólo una de varias posibles observa- 
ciones. 


v 


Esta definición es más general que la que se emplea en las ciencias físicas, en las que es 
de Imaginar a alguien que manipula tubos de ensayo o microscopios. Respecto de la proba- 
bilidad, un experimento tiene dos o más posibles resultados y no se sabe cuál ocurrirá. 


(J 


3 


RESULTADO Resultado particular de un experimento. 



5.2 ¿Qué es la probabilidad? 
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Por ejemplo, lanzar una moneda al aire constituye un experimento. Usted puede observar 
el lanzamiento de una moneda, pero no está seguro si caerá cara o cruz. De manera similar, 
preguntar a 500 estudiantes universitarios si comprarían un nuevo sistema de cómputo Dell a 
cierto precio constituye un experimento. Si se lanza una moneda, un resultado particular es 
cara. El otro posible resultado es cruz. En el experimento de la compra de la computadora, un 
posible resultado es que 273 estudiantes indiquen que les gustaría comprar la computadora. 
Otro es que 317 estudiantes la compren. Todavía hay otro resultado, que 423 estudiantes Indi- 
quen que la comprarían. Cuando se observan uno o más resultados en los experimentos, 
constituyen un evento. 


G 


3 


EVENTO Conjunto de uno o más resultados de un experimento. 


En la siguiente figura se presentan ejemplos para aclarar las definiciones de los términos 
experimento, resultado y evento. 

En el caso del experimento del lanzamiento de un dado, hay seis posibles resultados, pero 
existen varios posibles eventos. Cuando se cuenta el número de miembros de la junta direc- 
tiva de las compañías Fortune 500 que tienen más de 60 años de antigüedad, el número posi- 
ble de resultados varía de cero al total de miembros. Hay un número aún mayor de eventos 
posibles en este experimento. 





Experimento 

Lanzamiento de un dado 

Listado del número 
de miembros de la junta 
directiva de las compañías 
de Fortune 500, mayores de 60 años 

Todos los posibles 

Se observa un 1 

Ninguno tiene más de 60 

resultados 

Se observa un 2 

Uno tiene más de 60 


Se observa un 3 

Dos tienen más de 60 


Se observa un 4 



Se observa un 5 

29 tienen más de 60 


Se observa un 6 

48 tienen más de 60 

Algunos posibles eventos 

Se observa un número par 

Más de 1 3 tiene más de 60 


Se observa un número mayor que 4 

Se observa un 3 o un número menor 

Menos de 20 tiene más de 60 



Video Games, Inc., creó recientemente un nuevo videojuego. Ochenta jugadores veteranos van a 
probar su facilidad de operación. 

a) ¿En qué consiste el experimento? 

b) ¿Cuál es uno de los posibles resultados? 

c) Suponga que 65 jugadores intentaron jugar el nuevo juego y dicen que les gustó. ¿Es 65 una pro- 
babilidad? 

d) La probabilidad de que el nuevo juego sea un éxito es de -1 .0. Haga comentarios al respecto. 

e) Especifique un posible evento. 
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CAPÍTULO 5 Estudio de los conceptos de la probabilidad 


OA2 Identificar y aplicar el 
enfoque adecuado para 
asignar probabilidades. 


Cjemplo 

Solución 


5.3 Enfoques para asignar probabilidades 

Conviene analizar dos perspectivas para asignar probabilidades: los enfoques objetivo y sub- 
jetivo. La probabilidad objetiva se subdivide en a) probabilidad clásica y b) probabilidad empí- 
rica. 

Probabilidad clásica 

La probabilidad clásica parte del supuesto de que los resultados de un experimento son 
igualmente posibles. De acuerdo con el punto de vista clásico, la probabilidad de un evento 
que se está llevando a cabo se calcula dividiendo el número de resultados favorables entre el 
número de posibles resultados: 


PROBABILIDAD CLASICA 


Probabilidad _ Número de resultados favorables 
de un evento Número total de posibles resultados 


(5-1) 


Considere el experimento de lanzar un dado. ¿Cuál es la probabilidad del evento “cae un 
número par de puntos”? 


Los posibles resultados son: 



Hay tres resultados favorables (un dos, un cuatro y un seis) en el conjunto de seis resultados 
igualmente posibles. Por consiguiente, 


Probabilidad de un número par = — 

6 

= .5 


— 

Número de resultados favorables 

Número total de posibles resultados 


El concepto de conjuntos mutuamente excluyentes se presentó en el estudio de las distribu- 
ciones de frecuencias en el capítulo 2. Recordemos que creamos clases de tal manera que un 
evento particular se Incluyera en una sola de las clases y que no hubiera superposición entre 
ellas. Por lo tanto, sólo uno de varios eventos puede presentarse en cierto momento. 


MUTUAMENTE EXCLUYENTE El hecho de que un evento se presente significa que ninguno de 
los demás eventos puede ocurrir al mismo tiempo. 


La variable género da origen a resultados mutuamente excluyentes: hombre y mujer. Un 
empleado seleccionado al azar es hombre o mujer, pero no puede tener ambos géneros. Una 
pieza fabricada es aceptable o no lo es. La pieza no puede ser aceptable e inaceptable al 
mismo tiempo. En una muestra de piezas fabricadas, el evento de seleccionar una pieza no 
aceptable y el evento de seleccionar una pieza aceptable son mutuamente excluyentes. 



5.3 Enfoques para asignar probabilidades 
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Si un experimento incluye un conjunto de eventos con todo tipo de resultados posibles, 
como los eventos “un número par” y “un número impar” en el experimento del lanzamiento del 
dado, entonces el conjunto de eventos es colectivamente exhaustivo. En el experimento del 
lanzamiento del dado, cada resultado será par o impar. Por consiguiente, el conjunto es colec- 
tivamente exhaustivo. 


COLECTIVAMENTE EXHAUSTIVO Por lo menos uno de los eventos debe ocurrir cuando se lleva a 
cabo un experimento. 


Si el conjunto de eventos es colectivamente exhaustivo y los eventos son mutuamente 
excluyentes, la suma de las probabilidades es 1 . En términos históricos, el enfoque clásico de 
la probabilidad fue creado y aplicado en los siglos xvn y xvm a los juegos de azar, como las car- 
tas y los dados. Resulta Innecesario llevar a cabo un experimento para determinar la probabi- 
lidad de un evento mediante el enfoque clásico, ya que el número total de resultados se sabe 
antes de realizar el experimento. Lanzar una moneda tiene dos posibles resultados; arrojar un 
dado tiene seis posibles resultados. Por lógica, es posible determinar la probabilidad de sacar 
una cruz al lanzar una moneda o tres caras al lanzar tres monedas. 

El enfoque clásico de la probabilidad también puede aplicarse a la lotería. En Carolina del 
Sur, uno de los juegos de la Lotería Educativa es “Pick 3”. Para concursar, una persona com- 
pra un billete de lotería y selecciona tres números entre 0 y 9. Una vez a la semana, tres núme- 
ros son seleccionados en forma aleatoria de una máquina que hace girar tres contenedores, 
cada uno de los cuales contiene bolas numeradas de 0 a 9. Una forma de ganar consiste en 
atinar los números, así como el orden de éstos. Dado que hay 1 000 posibles resultados (000 
a 999), la probabilidad de ganar con un número de tres dígitos es de 0.001 , o 1 en 1 000. 

Probabilidad empírica 

La probabilidad empírica o frecuencia relativa, el segundo tipo de probabilidad, se basa en 
el número de veces que ocurre el evento como proporción del número de intentos conocidos. 


PROBABILIDAD EMPÍRICA La probabilidad de que un evento ocurra representa una fracción 
de los eventos similares que sucedieron en el pasado. 


En términos de una fórmula: 


Probabilidad empírica 


Número de veces que el evento ocurre 
Número total de observaciones 


El enfoque empírico de la probabilidad se basa en la llamada ley de los grandes números. La 
clave para determinar probabilidades de forma empírica consiste en que una mayor cantidad 
de observaciones proporcionarán un cálculo más preciso de la probabilidad. 


LEY DE LOS GRANDES NÚMEROS En una gran cantidad de intentos, la probabilidad empírica de 
un evento se aproximará a su probabilidad real. 


Para explicar la ley de los grandes números, supongamos que lanzamos una moneda común. 
El resultado de cada lanzamiento es cara o cruz. Si lanza la moneda una sola vez, la probabi- 
lidad empírica de las caras es cero o uno. Si lanzamos la moneda una gran cantidad de veces, 
la probabilidad del resultado de las caras se aproximará a 0.5. La siguiente tabla muestra los 
resultados de un experimento en el que se lanza una moneda 1,10, 50, 100, 500, 1 000 y 
10 000 veces, y, en seguida, se calcula la frecuencia relativa de las caras. Observe que con- 
forme incrementamos el número de intentos, la probabilidad empírica de que salga una cara 
se aproxima a 0.5, que es su valor de acuerdo con el enfoque clásico de la probabilidad. 
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CAPÍTULO 5 Estudio de los conceptos de la probabilidad 


Número de ensayos 

Número de caras 

Frecuencia relativa de las caras 

1 

0 

.00 

10 

3 

.30 

50 

26 

.52 

100 

52 

.52 

500 

236 

.472 

1 000 

494 

.494 

10 000 

5 027 

.5027 


¿Qué hemos demostrado? A partir de la definición clásica de probabilidad, la posibilidad de 
obtener una cara en un solo lanzamiento de una moneda común es de 0.5. Según el enfoque 
empírico de la frecuencia relativa de la probabilidad, la probabilidad del evento se aproxima al 
mismo valor determinado de acuerdo con la definición clásica de probabilidad. 

Este razonamiento permite emplear el enfoque empírico y de la frecuencia relativa para 
determinar una probabilidad. He aquí algunos ejemplos. 

• El semestre anterior, 80 estudiantes se registraron para Estadística Administrativa 101 en 
la Scandia University. Doce estudiantes obtuvieron A. Con base en dicha información y de 
acuerdo con la regla empírica de la probabilidad, la posibilidad calculada de que un estu- 
diante obtenga una A es de 0.15. 

• Kobe Bryant, jugador de Los Angeles Lakers logró 403 de 491 intentos de tiro libre duran- 
te la temporada 2009-2010 de la NBA. De acuerdo con la regla empírica de la probabili- 
dad, las posibilidades de lograr su siguiente intento de tiro son de 0.821. 

Las compañías de seguros de vida confían en datos similares a los anteriores para determinar 
la aceptabilidad de un solicitante, así como la prima que se le va a cobrar. Las tablas de mor- 
talidad incluyen una lista de las posibilidades de que una persona de determinada edad fallez- 
ca en el siguiente año. Por ejemplo, la probabilidad de que una mujer de 20 años de edad 
fallezca en el siguiente año es de 0.00105. 

El concepto empírico se ilustra con el siguiente ejemplo. 


r 

Cjemplo 

El 1 de febrero de 2003 explotó el transbordador espacial Columbia. Éste fue el segundo de- 
sastre en 1 13 misiones espaciales de la NASA. Con base en esta información, ¿cuál es la pro- 


babilidad de que una futura misión concluya con éxito? 

Solución 

Para simplificar, utilice letras o números. P representa a la probabilidad y, en este caso, P(A) 
representa la probabilidad de que una futura misión concluya con éxito. 


Número de vuelos exitosos 

Probabilidad de un vuelo exitoso = 

Número total de vuelos 


p W-^-.98 


Este resultado sirve como aproximación de la probabilidad. En otras palabras, por experien- 
cia, la probabilidad de que una futura misión del transbordador espacial concluya con éxito 
es de 0.98. 


Probabilidad subjetiva 

Si se cuenta con poca o ninguna experiencia o información con la cual sustentar la probabili- 
dad, es posible aproximarla en forma subjetiva. En esencia, esto significa que un individuo 
evalúa las opiniones e información disponibles y luego calcula o asigna la probabilidad. Esta 
probabilidad se denomina adecuadamente probabilidad subjetiva. 


CONCEPTO SUBJETIVO DE PROBABILIDAD Posibilidad (probabilidad) de un evento en particular 
que asigna un individuo a partir de cualquier información que encuentre disponible. 


5.3 Enfoques para asignar probabilidades 
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Algunos ejemplos de probabilidad subjetiva son los siguientes: 

1 . Calcular la posibilidad de que los Patriotas de Nueva Inglaterra jueguen el Súper Tazón el 
año que viene. 

2. Calcular la posibilidad de que usted contraiga matrimonio antes de los 30 años. 

3. Calcular la posibilidad de que el déficit presupuestario de Estados Unidos se reduzca a la 
mitad en los siguientes 10 años. 

En la gráfica 5-1 se resumen los diferentes tipos de probabilidad. Un enunciado probabi- 
lísimo siempre asigna una posibilidad a un evento que no ha ocurrido aún. Por supuesto, hay 
un amplio grado de incertidumbre en este tipo de probabilidad, la cual se basa, principalmen- 
te, en el conocimiento que posee el individuo del proceso que estudia. Dado el amplio cono- 
cimiento que el individuo tiene acerca del lanzamiento de dados, puede establecer que la pro- 
babilidad de que aparezca un punto en el lanzamiento de un dado no cargado es de un sexto. 
Sin embargo, es escasa la experiencia respecto de la aceptación del mercado de un nuevo 
producto que no ha sido probado. Por ejemplo, aun cuando la directora de investigación de 
mercado prueba un producto recién creado en 40 tiendas minoristas y establece que existe 
70% de posibilidades de que el producto genere ventas por más de un millón de unidades, 
posee un conocimiento limitado sobre cómo reaccionarán los consumidores cuando se co- 
mercialice en todo el país. En ambos casos (el de la persona que lanza un dado y en el que se 
prueba un nuevo producto), el individuo asigna un valor probabilístico a un evento de interés, 
y sólo existe una diferencia, la confianza del pronosticador en la precisión de la aproximación. 
No obstante, prescindiendo del punto de vista, se aplicarán las mismas leyes de la probabili- 
dad (que se exponen en las siguientes secciones). 



GRÁFICA 5-1 Resumen de enfoques de la probabilidad 



1 . Se selecciona al azar una carta de una baraja convencional de 52 cartas. ¿Cuál es la probabili- 
dad de que la carta resulte ser una reina? ¿Qué enfoque de la probabilidad empleó para res- 
ponder la pregunta? 

2. El Center for Child Care publica información sobre 539 niños, así como el estado civil de sus 
padres. Hay 333 casados, 182 divorciados y 24 viudos. ¿Cuál es la probabilidad de que un niño 
elegido al azar tenga un padre divorciado? ¿Qué enfoque utilizó? 

3. ¿Cuál es la probabilidad de que el índice Industrial Dow Jones sea mayor que 12 000 durante los 
próximos 12 meses? ¿Qué enfoque de la probabilidad utilizó para responder la pregunta? 
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Ejercicios 

1. Hay personas que apoyan la reducción de los impuestos federales con el fin de incrementar los 
gastos del consumidor, aunque otros están en contra. Se seleccionan dos personas y se registran 
sus opiniones. Si ninguna está indecisa, elabore una lista de los posibles resultados. 

2. Un inspector de control de calidad selecciona una pieza para probarla. Luego, la declara acepta- 
ble, reparable o chatarra. Entonces se prueba otra pieza. Elabore una lista de los posibles resulta- 
dos de este experimento relacionado con dos piezas. 

3. Una encuesta de 34 estudiantes en la Wall College of Business mostró que éstos tienen las 
siguientes especialidades: Sj ¡i 


Contabilidad 

10 

Finanzas 

5 

Economía 

3 

Administración 

6 

Marketing 

10 


Suponga que elige a un estudiante y observa su especialidad. 

a) ¿Cuál es la probabilidad de que el estudiante tenga una especialidad en Administración? 

b) ¿Qué concepto de probabilidad utilizó para hacer este cálculo? 

4. Una compañía grande que debe contratar un nuevo presidente prepara una lista final de cinco can- 
didatos, todos con las mismas cualidades. Dos de ellos son miembros de un grupo minoritario. 
Para evitar que el prejuicio influya en el momento de elegir al presidente, la compañía decide ele- 
girlo por sorteo. 

a) ¿Cuál es la probabilidad de que uno de los candidatos que pertenece a un grupo minoritario 
sea contratado? 

b) ¿Qué concepto de probabilidad utilizó para hacer este cálculo? 

5. En cada uno de los siguientes casos, indique si se utilizó la probabilidad clásica, empírica o sub- 
jetiva. 

a) Un jugador de béisbol consigue 30 hits en 100 turnos al bate. La probabilidad de que consiga 
un hit en su siguiente turno es de 0.3. 

b) Para estudiar problemas ambientales se forma un comité de estudiantes con siete miembros. 
¿Cuál es la probabilidad de que cualquiera de los siete sea elegido vocero del equipo? 

c) Usted compra uno de 5 millones de boletos vendidos por el Lotto Cañada. ¿Cuáles son las 
posibilidades de que gane un millón de dólares? 

d) La probabilidad de un terremoto al norte de California en los próximos 10 años es de 0.80. 

6. Una empresa promoverá a dos empleados de un grupo de seis hombres y tres mujeres. 

a) Elabore una lista de los resultados de este experimento, si existe un interés particular por la 
igualdad de género. 

b) ¿Qué concepto de probabilidad utilizaría para calcular estas probabilidades? 

7. Se eligió una muestra de 40 ejecutivos de la industria del petróleo para someter a prueba un cues- 
tionario. Una pregunta relacionada con cuestiones ambientales requería un sí o un no. 

a) ¿En qué consiste el experimento? 

b) Indique un posible evento. 

c) Diez de los 40 ejecutivos respondieron que sí. Con base en estas respuestas de la muestra, 
¿cuál es la probabilidad de que un ejecutivo de la industria del petróleo responda que sí? 

d) ¿Qué concepto de probabilidad se ilustra? 

e) ¿Los posibles resultados son igualmente probables y mutuamente excluyentes? 

8. Una muestra de 2 000 conductores con licencia reveló la siguiente cantidad de violaciones al lími- 
te de velocidad. m 


Cantidad de violaciones 

Cantidad de conductores 

0 

1 910 

1 

46 

2 

18 

3 

12 

4 

9 

5 o más 

5 

Total 

2 000 


a) ¿En qué consiste el experimento? 

b) Indique un posible evento. 
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c) ¿Cuál es la probabilidad de que un conductor haya cometido dos violaciones al límite de velo- 
cidad? 

d) ¿Qué concepto de probabilidad se ilustra? 

9. Los clientes del Bank of America seleccionan su propio número de identificación personal de tres 
dígitos (NIP), para emplearlo en los cajeros automáticos. 

a) Considere esto un experimento y haga una lista de cuatro posibles resultados. 

Jb) ¿Cuál es la probabilidad de que el señor Jones y la señora Smith seleccionen el mismo NIP? 
c) ¿Qué concepto de probabilidad utilizó en la respuesta £>)? 

10. Un inversionista compra 100 acciones de AT&T y registra los cambios de precio diariamente. 

a) Elabore una lista de los posibles eventos de este experimento. 

b) Calcule la probabilidad de cada evento descrito en el inciso a). 

c) ¿Qué concepto de probabilidad utilizó en b )? 

5.4 Algunas reglas para calcular probabilidades 

Ahora, una vez definida la probabilidad y descrito sus diferentes enfoques, cabe atender al 
cálculo de la probabilidad de dos o más eventos aplicando las reglas de la adición y la multi- 
plicación. 

Reglas de la adición 

Existen dos reglas de la adición: la regla especial de la adición y la regla general de la adición. 
Primero la regla especial de la adición. 

OA3 Calcular probabilida- Regla especial de la adición Para aplicar la regla especial de la adición, los eventos 
des mediante las reglas de la deben ser mutuamente excluyentes. Recuerde que mutuamente excluyentes significa que 
adición. cuando un evento ocurre, ninguno de los demás eventos puede ocurrir al mismo tiempo. Un 

ejemplo de eventos mutuamente excluyentes en el experimento del lanzamiento del dado son 
los eventos “un número 4 o mayor” y “un número 2 o menor”. Si el resultado se encuentra en 
el primer grupo {4, 5 y 6}, entonces no puede estar en el segundo grupo {1 y 2}. Otro ejemplo 
consiste en que un producto proveniente de la línea de montaje no puede estar defectuoso y 
en buen estado al mismo tiempo. 

Si dos eventos A y B son mutuamente excluyentes, la regla especial de la adición esta- 
blece que la probabilidad de que ocurra uno u otro es igual a la suma de sus probabilidades. 
Esta regla se expresa mediante la siguiente fórmula: 


r 


REGLA ESPECIAL DE LA ADICION 


P(A oB) = P(A) + P(B) 


(5-2) 


En el caso de los tres eventos mutuamente excluyentes designados A, B y C, la regla se 
expresa de la siguiente manera: 

P(A o B o C) = P(A) + P(B) + P(C ) 

Un ejemplo ayudará a entender los detalles. 


r 



Cjemplo 


Una máquina automática llena bolsas de plástico con una combinación de frijoles, brócoli y 
otras verduras. La mayoría de las bolsas contiene el peso correcto, aunque, como consecuen- 
cia de la variación del tamaño del frijol y de otras verduras, un paquete 
podría pesar menos o más. Una revisión de 4 000 paquetes que se lle- 
naron el mes pasado arrojó los siguientes datos: 


Peso 

Evento 

Número de 
paquetes 

Probabilidad de 
que ocurra el evento 


Menos peso 

A 

100 

.025 

100 

4 000 

Peso satisfactorio 

B 

3 600 

.900 

Más peso 

C 

300 

4 000 

.075 

1.000 



154 


CAPÍTULO 5 Estudio de los conceptos de la probabilidad 



¿Cuál es la probabilidad de que un paquete en particular pese menos o pese más? 

Solución 

El resultado “pesa menos” es el evento A. El resultado “pesa más” es el evento C. Al aplicar la 
regla especial de la adición se tiene: 


P(A o C) = P(A) + P(C) = .025 + 0.75 = .10 


Observe que los eventos son mutuamente excluyentes, lo cual significa que un paquete de ver- 
duras mixtas no puede pesar menos, tener el peso satisfactorio y pesar más al mismo tiempo. 
Éstos también son colectivamente exhaustivos; es decir, que un paquete seleccionado debe 
pesar menos, tener un peso satisfactorio o pesar más. 


El lógico inglés J. Venn (1834-1923) creó un diagrama para representar de manera gráfica 
el resultado de un experimento. El concepto de eventos mutuamente excluyentes, así como de 
otras reglas para combinar probabilidades, se ¡lustra mediante este dispositivo. Para construir 
un diagrama de Venn, primero se encierra un espacio, el cual representa el total de posibles 
resultados. Este espacio es de forma rectangular. Así, un evento se representa por medio de 
un área circular, que se dibuja dentro del rectángulo, la cual corresponde a la probabilidad del 
evento. El siguiente diagrama de Venn ¡lustra el concepto de eventos mutuamente excluyen- 
tes. Los eventos no se superponen, lo cual significa que son mutuamente excluyentes. En el 
siguiente diagrama suponga que los eventos A, B y C son igualmente probables. 



Regla del complemento La probabilidad de que una bolsa de verduras mixtas seleccio- 
nadas pese menos, P(A), más la probabilidad de que no sea una bolsa con menos peso, P{~A), 
que se lee no A, deber ser por lógica igual a 1 . Esto se escribe: 

P(A) + P(~A) = 1 

Esta expresión puede reformularse: 


REGLA DEL COMPLEMENTO 


P(A) = 1 - P(~A) 


(5-3) 


Tal es la regla del complemento. Se emplea para determinar la probabilidad de que un even- 
to ocurra restando de 1 la probabilidad de un evento que no ha ocurrido. Esta regla es útil por- 
que a veces es más fácil calcular la probabilidad de que un evento suceda determinando la 
probabilidad de que no suceda y restando el resultado de 1 . Observe que los eventos A y ~A 
son mutuamente excluyentes y colectivamente exhaustivos. Por consiguiente, las probabilida- 
des de A y ~A suman 1 . Un diagrama de Venn ilustra la regla del complemento de la siguien- 
te manera: 
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Recuerde que la probabilidad de que una bolsa de verduras mixtas pese menos es de 0.025 y 
la probabilidad de que pese más es de 0.075. Aplique la regla del complemento para demos- 
trar que la probabilidad de una bolsa con un peso satisfactorio es de 0.900. Muestre la solu- 
ción en un diagrama de Venn. 

La probabilidad de que la bolsa no tenga un peso satisfactorio es igual a la probabilidad de que 
tenga mayor peso más la probabilidad de que pese menos. Es decir que P(A o C) = P(A) + P(C) 
= .025 + .075 = .100. La bolsa tiene un peso satisfactorio si no tiene menos peso ni más peso; 
así que P(B) = 1 - [P(A) + P(C)] = 1 - [.025 + .075] = 0.900. El diagrama de Venn que represen- 
ta este caso es el siguiente: 




Se va a encuestar a una muestra de empleados de Worldwide Enterprises sobre un nuevo plan de 
cuidado de la salud. Los empleados se clasifican de la siguiente manera: 


Clasificación 

Evento 

Número de empleados 

Supervisores 

A 

120 

Mantenimiento 

B 

50 

Producción 

C 

1 460 

Administración 

D 

302 

Secretarias 

E 

68 


a) ¿Cuál es la probabilidad de que la primera persona elegida sea: 
i) de mantenimiento o secretaria? 

//) que no sea de administración? 

b) Dibuje un diagrama de Venn que ilustre sus respuestas al inciso a). 

c) ¿Los eventos del inciso á)i) son complementarios, mutuamente excluyentes o ambos? 


Regla general de la adición Los resultados de un experimento pueden no ser mutua- 
mente excluyentes. Como ilustración, supongamos que Florida Tourist Commission seleccio- 
nó una muestra de 200 turistas que visitaron el estado durante el año. La encuesta reveló que 
120 turistas fueron a Disney World y 100 a Busch Gardens, cerca de Tampa. ¿Cuál es la pro- 
babilidad de que una persona seleccionada haya visitado Disney World o Busch Gardens? Si 
se emplea la regla especial de la adición, la probabilidad de seleccionar un turista que haya 
ido a Disney World es de 0.60, que se determina mediante la división 1 20/200. De manera simi- 
lar, la probabilidad de que un turista vaya a Busch Gardens es de 0.50. La suma de estas pro- 
babilidades es de 1 .1 0. Sin embargo, sabemos que esta probabilidad no puede ser mayor que 1 . 
La explicación es que muchos turistas visitaron ambas atracciones turísticas y se les ha con- 
tado dos veces. Una revisión de las respuestas de la encuesta reveló que 60 de los 200 
encuestados visitó, en realidad, ambas atracciones turísticas. 

Para responder cuál es la probabilidad de elegir a una persona que haya visitado Disney 
World o Busch Gardens, 1) sume la probabilidad de que un turista haya visitado Disney World 
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Estadística en acción 

Si usted desea llamar la 
atención en la siguiente 
reunión a la que asista, 
diga que usted cree que 
por lo menos dos perso- 
nas presentes nacieron en 
la misma fecha; es decir, 
el mismo día, pero no 
necesariamente el mismo 
año. Si hay 30 personas 
en la sala, la probabilidad 
de que las fechas se 
dupliquen es de 0.706. Si 
hay 60 personas en la 
sala, la probabilidad de 
que por lo menos dos 
personas compartan la 
misma fecha de cumplea- 
ños es de 0.994. Si sólo 
hay 23 personas, las pro- 
babilidades son iguales, 
es decir, 0.50, de que por 
lo menos dos personas 
cumplan años la misma 
fecha. Sugerencia: Para 
calcularlo, determine la 
probabilidad de que 
todos hayan nacido en 
distintos días y aplique la 
regla del complemento. 
Inténtelo en clase. 




y la probabilidad de que haya visitado Busch Gardens; y 2) reste la probabilidad de que haya 
visitado ambas atracciones turísticas. Por consiguiente: 

P(Disney o Busch) = P(Disney) + P(Busch) - P(tanto Disney como Busch) 

= 0.60 + 0.50 - 0.30 = 0.80 

Cuando dos eventos ocurren al mismo tiempo, la probabilidad se denomina probabilidad 
conjunta. La probabilidad de que un turista visite ambas atracciones turísticas (0.30) es un 
ejemplo de probabilidad conjunta. 

El siguiente diagrama de Venn muestra dos eventos que no son mutuamente excluyentes. 
Ambos se superponen para ilustrar el evento conjunto de que algunas personas hayan visita- 
do ambas atracciones. 


P(Disney) = .60 P(Busch) = .50 



OA4 Definir el término 
probabilidad conjunta. 


PROBABILIDAD CONJUNTA Probabilidad que mide la posibilidad de que dos o más eventos 
sucedan simultáneamente. 


Esta regla para dos eventos designados Ay B se escribe: 


0 


(5-4) 


REGLA GENERAL DE LA ADICION 


P(A o B) = P(A) + P(B) - P(A y B) 
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En el caso de la expresión P(A o fí), la conjunción o sugiere que puede ocurrir A o puede ocu- 
rrir B. Esto también incluye la posibilidad de que A y B ocurran. Tal uso de o a veces se deno- 
mina inclusivo. También es posible escribir P(A o B o ambos) para hacer hincapié en el hecho 
de que la unión de dos eventos incluye la intersección de Ay B. 

Si comparamos las reglas general y especial de la adición, la diferencia que importa con- 
siste en determinar si los eventos son mutuamente excluyentes. Si lo son, entonces la proba- 
bilidad conjunta P(A y B) es 0 y podríamos aplicar la regla especial de la adición. De lo contra- 
rio, debemos tomar en cuenta la probabilidad conjunta y aplicar la regla general de la adición. 


r 

Cjemplo 


Solución 




¿Cuál es la probabilidad de que una carta escogida al azar de una baraja convencional sea rey 
o corazón? 

Quizá se sienta tentado a sumar la probabilidad de sacar un rey y la probabilidad de sacar un 
corazón. Sin embargo, este enfoque crea problemas. Al hacerlo así, cuenta al rey de corazo- 
nes con los reyes y lo mismo sucede con los corazones. De esta manera, si suma la probabi- 
lidad de sacar un rey (hay 4 en una baraja de 52 cartas) a la probabilidad de sacar un corazón 
(hay 13 en una baraja de 52 cartas) 17 de 52 cartas cumplen con el requisito, pero ha contado 
dos veces el rey de corazones. Necesita restar una carta de las 17, de tal manera que el rey de 
corazones sólo se cuente una vez. Por lo tanto, hay 16 cartas que son corazones o reyes. Así 
que la probabilidad es de 16/52 = 0.3077. 


Carta 

Probabilidad 

Explicación 

Rey 

P(A) 

= 4/52 

4 reyes en una baraja de 52 cartas 

Corazón 

P(B) 

= 13/52 

13 corazones en una baraja de 52 cartas 

Rey de corazones 

P(A y B) 

= 1/52 

1 rey de corazones en una baraja de 52 cartas 


De acuerdo con la fórmula (5-4): 

P{A o B) = P(A ) + P(B) - P(A y B) 

= 4/52 + 13/52 - 1/52 
= 16/52, o .3077 

Un diagrama de Venn representa estos resultados, que no son mutuamente excluyentes. 
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Autoevaluación 


5-4 


Cada año se ilevan a cabo exámenes físicos de rutina como parte de un programa de servicios de 
salud para los empleados de General Concrete, Inc. Se descubrió que 8% de los empleados 
requieren calzado ortopédico; 15% necesitan tratamiento dental mayor y 3% tanto zapatos ortopé- 
dicos como tratamiento dental mayor. 

a) ¿Cuál es la probabilidad de que un empleado elegido de forma aleatoria requiera zapatos orto- 
pédicos o tratamiento dental mayor? 
ti) Muestre esta situación en forma de diagrama de Venn. 



comed 


Ejercicios 

11. Los eventos A y 6 son mutuamente excluyentes. Suponga que P(A) = 0.30 y P (6) = 0.20. ¿Cuál 
es la probabilidad de que ocurran ya sea A o S? ¿Cuál es la probabilidad de que ni A ni 6 suce- 
dan? 

12. Los eventos X y Y son mutuamente excluyentes. Si P(X) = 0.05 y P (V) = 0.02, ¿cuál es la proba- 
bilidad de que X o Y ocurran? ¿Cuál es la probabilidad de que ni X ni y sucedan? 

13. Un estudio de 200 empresas de publicidad reveló los siguientes ingresos después de impues- 
tos: 


Ingreso después de impuestos 

Número de empresas 

Menos de $1 millón 

102 

De $1 millón a $20 millones 

61 

$20 millones o más 

37 


a) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un 
ingreso después de impuestos menor a $1 millón? 
ib) ¿Cuál es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un 
ingreso después de impuestos entre $1 millón y $20 millones o un ingreso de $20 millones o 
más? ¿Qué regla de probabilidad aplicó? 

14. El presidente de la junta directiva afirma: “Hay 50% de posibilidades de que esta compañía obten- 
ga utilidades; 30% de que termine sin pérdidas ni ganancias y 20% de que pierda dinero durante 
el próximo trimestre.” 

a) Aplique una de las reglas de la adición para determinar la probabilidad de que la compañía no 
pierda dinero el siguiente trimestre. 

b) Aplique la regla del complemento para determinar la probabilidad de que no pierda dinero el 
próximo trimestre. 

15. Suponga que la probabilidad de que saque una A en esta clase es de 0.25 y que la probabilidad 
de obtener una B es de 0.50. ¿Cuál es la probabilidad de que su calificación sea mayor que C? 

16. Se lanzan al aire dos monedas. Si A es el evento “dos caras” y B es el evento “dos cruces”, ¿A y 
B son mutuamente excluyentes? ¿Son complementos? 

17. Las probabilidades de los eventos A y B son 0.20 y 0.30, respectivamente. La probabilidad de que 
A y B ocurran es de 0.15. ¿Cuál es la probabilidad de que A o B ocurran? 

18. Sean P(X) = 0.55 y P (Y) = 0.35. Suponga que la probabilidad de que ambos ocurran es de 0.20. 
¿Cuál es la probabilidad de que X o y ocurran? 

19. Suponga que los dos eventos A y B son mutuamente excluyentes. ¿Cuál es la probabilidad de que 
se presenten de forma conjunta? 

20. Un estudiante toma dos cursos, historia y matemáticas. La probabilidad de que pase el curso de 
historia es de 0.60 y la de que apruebe el de matemáticas es de 0.70. La probabilidad de pasar 
ambos es de 0.50. ¿Cuál es la probabilidad de pasar por lo menos uno? 

21. Una encuesta sobre tiendas de comestibles del sureste de Estados Unidos reveló que 40% tenían 
farmacia, 50% florería y 70% salchichonería. Suponga que 10% de las tiendas cuentan con los 
tres departamentos, 30% tienen tanto farmacia como salchichonería, 25% tienen florería y salchi- 
chonería y 20% tienen tanto farmacia como florería. 

a) ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta con 
farmacia y florería? 

Jb) ¿Cuál es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta con 
farmacia y salchichonería? 



0A5 Calcular probabilida- 
des mediante las reglas de la 
multiplicación. 


Cjemplo 
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c) Los eventos “seleccionar una tienda con salchichonería” y “seleccionar una tienda con farma- 
cia”, ¿son mutuamente excluyentes? 

d) ¿Qué nombre se da al evento “seleccionar una tienda con farmacia, florería y salchichonería”? 

e) ¿Cuál es la probabilidad de seleccionar una tienda que no incluya los tres departamentos? 

22. Un estudio llevado a cabo por el National Service Park reveló que 50% de los vacacionistas que 

se dirigen a la región de las Montañas Rocallosas visitan el parque de Yellowstone, 40% los Tetons 
y 35% ambos lugares. 

a) ¿Cuál es la probabilidad de que un vacacionista visite por lo menos una de estas atracciones? 

b) ¿Qué nombre recibe la probabilidad de 0.35? 

c) ¿Los eventos son mutuamente excluyentes? Explique su respuesta. 

Reglas de la multiplicación 

Cuando empleamos las reglas de la adición en la sección anterior, determinamos la probabili- 
dad de combinar dos eventos. En esta sección estimará la probabilidad de que la ocurrencia 
de dos eventos sea simultánea. Por ejemplo, una empresa de marketing desea calcular la pro- 
babilidad de que una persona de 21 años de edad o mayor compre una Hummer. Los diagra- 
mas de Venn ¡lustran este hecho como la intersección de dos eventos. Para determinar la pro- 
babilidad de dos eventos que se presentan simultáneamente emplee la regla de la multiplica- 
ción. Hay dos reglas de la multiplicación, la regla especial y la regla general. 

Regla especial de la multiplicación La regla especial de la multiplicación requiere que 
dos eventos, Ay B, sean independientes, y lo son si el hecho de que uno ocurra no altera la 
probabilidad de que el otro suceda. 


INDEPENDENCIA Si un evento ocurre, no tiene ningún efecto sobre la probabilidad de que otro 
evento acontezca. 

V J 


Una forma de entender la independencia consiste en suponer que los eventos A y B ocu- 
rren en diferentes tiempos. Por ejemplo, cuando el evento B ocurre después del evento A, 
¿influye A en la probabilidad de que el evento B ocurra? Si la respuesta es no, entonces A y 
B son eventos independientes. Para ¡lustrar la Independencia, supongamos que se lanzan al 
aire dos monedas. El resultado del lanzamiento de una moneda (cara o cruz) no se altera por 
el resultado de cualquier moneda lanzada previamente (cara o cruz). 

En el caso de dos eventos independientes Ay B, la probabilidad de que Ay B ocurran se 
determina multiplicando las dos probabilidades, tal es la regla especial de la multiplicación, 
cuya expresión simbólica es la siguiente: 


r 


REGLA ESPECIAL DE LA MULTIPLICACION 


P(A y B) = P(A)P(B) 


(5-5) 


En el caso de tres eventos independientes, A, B y C, la regla especial de la multiplicación 
que se utiliza para determinar la probabilidad de que los tres eventos ocurran es: 

P{A y B y C) = P{A)P(B)P(C) 


Una encuesta que llevó a cabo la American Automobile Association (AAA) reveló que el año 
pasado 60% de sus miembros hicieron reservaciones en líneas aéreas. Dos de ellos fueron 
seleccionados al azar. ¿Cuál es la probabilidad de que ambos hicieran reservaciones el año 
pasado? 

La probabilidad de que el primero haya hecho una reservación el año pasado es de 0.60, que 
se expresa como P(R^¡) - .60, en la que R representa el hecho de que el primer miembro hizo 
una reservación. 


Solución 
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OA6 Definir el término 
probabilidad condicional. 


La probabilidad de que el segundo miembro elegido haya hecho una reservación es también 
de 0.60, así que P(R 2 ) = -60. Como el número de miembros de la AAA es muy grande, se supo- 
ne que y R z son independientes. En consecuencia, de acuerdo con la fórmula (5-5), la pro- 
babilidad de que ambos hayan hecho una reservación es de 0.36, que se calcula de la siguien- 
te manera: 


P{R ! y R z ) = P(Ri)P(R 2 ) = (,60)(.60) = .36 

Todos los posibles resultados pueden representarse como se muestra a continuación. Aquí, R 
significa que se hizo la reservación y NR, que no se hizo. 

Con las probabilidades y la regla del complemento se calcula la probabilidad conjunta de 
cada resultado. Por ejemplo, la probabilidad de que ningún miembro haga una reservación es 
de 0.16. Además, la probabilidad de que el primero y el segundo miembros (regla especial de 
la adición) hagan una reservación es de 0.48 (0.24 + 0.24). También se puede observar que los 
resultados son mutuamente excluyentes y colectivamente exhaustivos. Por lo tanto, las proba- 
bilidades suman 1.00. 


Resultados 

Probabilidad conjunta 


/?! /? 2 

(,60)(.60) = 

.36 

/?! NR 2 

(,60)(.40) = 

.24 

«/?! fl 2 

(,40)(.60) = 

.24 

«/?! /W? 2 

(,40)(.40) = 

.16 

Total 


1.00 


Por experiencia, Tetón Tire sabe que la probabilidad de que una llanta XB-70 rinda 60 000 millas 
antes de que quede lisa o falle es de 0.95. A cualquier llanta que no dure las 60 000 millas se le 
hacen arreglos. Usted adquiere cuatro llantas XB-70. ¿Cuál es la probabilidad de que las cuatro 
llantas tengan una duración de 60 000 millas? 


Regla general de la multiplicación Si dos eventos no son independientes, se dice que 
son dependientes. Con el fin de ilustrar el concepto de dependencia, supongamos que hay 
1 0 latas de refresco en un refrigerador, 7 de los cuales son normales y 3 dietéticos. Se saca 
una lata del refrigerador. La probabilidad de que sea una lata de refresco dietético es de 3/10, 
y la probabilidad de que sea una lata de refresco normal es de 7/10. Luego, se elige una 
segunda lata del refrigerador sin devolver la primera. La probabilidad de que la segunda lata 
sea de refresco dietético depende de que la primera lo haya sido o no. La probabilidad de que 
la segunda lata sea de refresco dietético es: 

2/9, si la primera bebida es dietética (sólo dos latas de refresco dietético quedan en el 
refrigerador). 

3/9, si la primera lata elegida es normal (los tres refrescos aún están en el refrigerador). 

La denominación adecuada de la fracción 2/9 (o 3/9) es probabilidad condicional, ya que su 
valor se encuentra condicionado (o depende) del hecho de que un refresco regular o dietético 
haya sido el primero en ser seleccionado del refrigerador. 


PROBABILIDAD CONDICIONAL Probabilidad de que un evento en particular ocurra, dado que 
otro evento haya acontecido. 
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La regla general de la multiplicación sirve para determinar la probabilidad conjunta de dos 
eventos cuando éstos no son independientes. Por ejemplo, cuando el evento B ocurre des- 
pués del evento A, y A influye en la probabilidad de que el evento B suceda, entonces A y B 
no son independientes. 

La regla general de la multiplicación establece que en caso de dos eventos, A y B, la pro- 
babilidad conjunta de que ambos eventos ocurran se determina multiplicando la probabilidad 
de que ocurra el evento A por la probabilidad condicional de que ocurra el evento S, dado que 
A ha ocurrido. Simbólicamente, la probabilidad conjunta, P(A y 6), se calcula de la siguiente 
manera: 




REGLA GENERAL DE LA MULTIPLICACION 


P(A y B) = P(A)P(B\A) 


(5-6) 


Cjemplo 


Solución 


Un golfista tiene 12 camisas en su clóset. Suponga que 9 son blancas y las demás azules. 
Como se viste de noche, simplemente toma una camisa y se la pone. Juega golf dos veces 
seguidas y no las lava. ¿Cuál es la probabilidad de que las dos camisas elegidas sean blan- 
cas? 



El evento que se relaciona con el hecho de que la primera camisa seleccionada sea blanca es 
l/l/-,. La probabilidad es P(l/1/-,) = 9/12, porque 9 de cada 12 camisas son blancas. El evento de 
que la segunda camisa seleccionada sea blanca también se identifica con l/l/ 2 . La probabilidad 
condicional relacionada con el hecho de que la segunda camisa seleccionada sea blanca, dado 
que la primera camisa seleccionada es blanca también, es P(W 2 \W-¡) = 8/11. ¿A qué se debe 
esto? A que después de que se selecciona la primera camisa, quedan 1 1 camisas en el clóset 
y 8 de éstas son blancas. Para determinar la probabilidad de que se elijan 2 camisas blancas 
aplicamos la fórmula (5-6): 

P(W, y W 2 ) = P(WJP(W 2 \WJ = ( ' ^) = .55 

Por consiguiente, la probabilidad de seleccionar dos camisas, y que ambas sean de color blan- 
co, es de 0.55. 


A propósito, se supone que este experimento se llevó a cabo sin reemplazo. Es decir, que 
la primera camisa no se lavó y se colocó en el clóset antes de hacer la selección de la segun- 
da. Así, el resultado del segundo evento es condicional o depende del resultado del primer 
evento. 

Es posible ampliar la regla general de la multiplicación para que incluya más de dos even- 
tos. En el caso de los tres eventos, A, B y C, la fórmula es: 

P{A y B y C) = P(/4)P(e|A)P(C|A y B) 

En el caso del ejemplo de la camisa de golf, la probabilidad de elegir tres camisas blancas sin 
reemplazo es: 

P(W, y W 2 y l/l/ 3 ) = P(WJP(W 2 \W,)P(W 3 \W, y W 2 ) = (^)(jf)(^) = - 38 

De esta manera, la probabilidad de seleccionar tres camisas sin reemplazo, todas las cuales 
sean blancas, es de 0.38. 
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Estadística en acción 

En 2000, George W. 

Bush ganó la presidencia 
de Estados Unidos por 
un mínimo margen. 
Surgieron muchas histo- 
rias sobre las elecciones, 
algunas de las cuales 
hablaban de irregularida- 
des en las votaciones y 
otras que dieron lugar a 
interesantes preguntas. 

En una elección local de 
Michigan, resultó un 
empate entre dos candi- 
datos para un puesto de 
elección. Para resolver el 
empate, los candidatos 
sacaron una hoja de 
papel de una caja que 
contenía dos hojas, una 
rotulada Ganador , y otra 
sin marcar. Para determi- 
nar qué candidato sacaría 
primero el papel, los fun- 
cionarios electorales lan- 
zaron una moneda al 
aire. El ganador del lan- 
zamiento también sacó el 
papel del ganador. Ahora 
bien, ¿era realmente 
necesario lanzar una 
moneda al aire? No, por- 
que los dos eventos son 
independientes. Ganar 
en el lanzamiento de la 
moneda no altera la pro- 
babilidad de que cual- 
quiera de los candidatos 
saque la hoja con el nom- 
bre del ganador. 



La junta directiva de Tarbell Industries consta de ocho hombres y cuatro mujeres. Un comité de 
cuatro miembros será elegido al azar para llevar a cabo una búsqueda, en todo el país, del nuevo 
presidente de la compañía. 

a) ¿Cuál es la probabilidad de que los cuatro miembros del comité de búsqueda sean mujeres? 

b) ¿De que los cuatro miembros del comité de búsqueda sean hombres? 

c) ¿Las probabilidades de los eventos descritos en los incisos a) y b) suman 1 ? Explique su res- 
puesta. 


5.5 Tablas de contingencias 

A menudo, los resultados de una encuesta se registran en una tabla de dos direcciones y se 
utilizan para determinar diversas probabilidades. Ya se ha descrito esta idea a partir de la pági- 
na 126 del capítulo 4. Para recordarlo: una tabla de dos direcciones es una tabla de contin- 
gencia. 


TABLA DE CONTINGENCIAS Tabla que se utiliza para clasificar observaciones de una muestra, 
de acuerdo con dos o más características identificables. 

y y 


Una tabla de contingencias consiste en una tabulación cruzada que resume simultáneamente 
dos variables de interés, así como la relación entre éstas. El nivel de medición puede ser nomi- 
nal. A continuación, algunos ejemplos. 

• Una encuesta de 1 50 adultos clasificados según su género y la cantidad de películas que 
vieron en el cine el mes pasado. Cada entrevistado se clasifica de acuerdo con dos crite- 
rios: la cantidad de películas que ha visto y el género. 


Películas vistas 

Hombres 

Género 

Mujeres 

Total 

0 

20 

40 

60 

1 

40 

30 

70 

2 o más 

10 

10 

20 

Total 

70 

80 

150 


• La American Coffee Producers Association proporciona la siguiente información sobre la 
edad y la cantidad de café que se consumió en un mes. 


Edad (años) 

Bajo 

Consumo de café 

Moderado 

Alto 

Total 

Menos de 30 

36 

32 

24 

92 

30 a 40 

18 

30 

27 

75 

40 a 50 

10 

24 

20 

54 

50 o más 

26 

24 

29 

79 

Total 

90 

TTo 

Too 

300 


De acuerdo con esta tabla, cada uno de los 300 entrevistados se clasifica según dos criterios: 
1) la edad; 2) la cantidad de café que consume. 
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OA7 Calcular probabilida- El siguiente ejemplo muestra la forma en que las reglas de adición y multiplicación se 

des por medio de una tabla emplean en tablas de contingencias, 
de contingencias. 


Cjemplo 



Solución 


Se entrevistó a una muestra de ejecutivos respecto de su lealtad a la compañía. Una de las 
preguntas fue: Si otra compañía le hace una oferta igual o le ofrece un puesto un poco mejor 
del que tiene ahora, ¿permanecería con la compañía o aceptaría el otro puesto? A partir de las 
respuestas de los 200 ejecutivos que participaron en la encuesta se hizo una clasificación cru- 
zada según el tiempo de servicio en la compañía. 

Lealtad de los ejecutivos y tiempo de servicio a la compañía 


Lealtad 


Tiempo de servicio 


Total 

Menos de 

1 año, 

Si 

1 a 5 
años, 

b 2 

6 a 10 
años, 

b 3 

Más de 

10 años, 

b 4 

Permanecería, A 

10 

30 

5 

75 

120 

No permanecería, 

25 

15 

10 

30 

80 


35 

45 

15 

105 

200 


¿Cuál es la probabilidad de seleccionar al azar a un ejecutivo leal a la compañía —que perma- 
necería en ella— y cuál de ellos tiene más de 10 años de servicio? 


Note que los dos eventos ocurren al mismo tiempo: el ejecutivo permanecería en la compañía 
y tiene más de 10 años de servicio. 

1 . El evento A 1 ocurre si un ejecutivo elegido de forma aleatoria permanece en la compañía 
a pesar de que otra empresa le haga una oferta igual o mejor. Para determinar la probabi- 
lidad de que el evento A 4 suceda, consulte la tabla 5-1. Note que hay 120 ejecutivos, de 
los 200 de la encuesta, que permanecerían en la compañía, de modo que P(A-¡) = 120/200, 
o 0.60. 

2. El evento S 4 sucede si un ejecutivo elegido al azar tiene más de 10 años de servicio en la 
compañía. Por consiguiente, P(S 4 |A 1 ) es la probabilidad condicional de que un ejecutivo 
con más de 10 años de servicio permanezca en la compañía a pesar de que otra firma le 
haga una oferta igual o mejor. Respecto de la tabla de contingencias, tabla 5-1, 75 de los 
120 ejecutivos que permanecerían tienen más de 10 años de servicio, así que P(S 4 |A 1 ) = 
75/120. 

Para despejar la probabilidad de elegir al azar un ejecutivo que permanezca en la compañía y 
que tenga más de 10 años de servicio, usando la regla general de la multiplicación, incluida en 
la fórmula (5-6), se obtiene: 


P(A, y b 4 ) = p(ajp(b 4 \aj = 


120 

200 


75 

120 


9 000 
24 000 


= .375 


Para determinar la probabilidad de elegir un ejecutivo que permanezca o que tenga menos de 
1 año de experiencia, aplique la regla general de la adición, la fórmula (5-4). 

1 . El evento A-¡ se refiere a los ejecutivos que permanecerían en la compañía. De este modo, 
P{AJ = 120/200 = .60. 

2. El evento B 1 se refiere a los ejecutivos que han laborado en la compañía menos de 1 año. 
La probabilidad de que ocurra B 1 es P(B-,) = 35/200 = .175. 

3. Los eventos A y B^ no son mutuamente excluyentes. Es decir que un ejecutivo puede 
querer permanecer en la compañía y tener menos de 1 año de experiencia. 
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Esta probabilidad, que recibe el nombre de probabilidad conjunta, aparece como P(A, y 
B-i). Hay 10 ejecutivos que permanecerían en la compañía y que cuentan con menos de 1 
año de experiencia, así que P(A , y B,) = 10/200 = 0.05. Estas 10 personas están en 
ambos grupos, los que se quedarían con la compañía y los que tienen menos de 1 año con 
la compañía. En realidad se les está contando dos veces, así que es necesario restar este 
valor. 

4. Sustituya estos valores en la fórmula (5-4) y el resultado es el siguiente: 

PÍA 1 o B,) = P(A,) + P(B-¡) - P(A , y B,) 

= .60 + .175 - .05 = .725 

Por lo tanto, la probabilidad de que un ejecutivo elegido permanezca en la compañía o haya 
laborado en ella menos de 1 año es de 0.725. 



Consulte la tabla 5-1 en la página 163 para calcular las siguientes probabilidades. 

a) De seleccionar a un ejecutivo con más de 10 años de servicio. 

b) De seleccionar a un ejecutivo que no permanezca en la compañía, dado que cuenta con más de 
10 años de servicio. 

c) De seleccionar a un ejecutivo con más de 10 años de servicio o a uno que no permanezca en la 
compañía. 


5.6 Diagramas de árbol 

El diagrama de árbol es una gráfica útil para organizar cálculos que implican varias etapas. 

Cada segmento del árbol constituye una etapa del problema. Las ramas del árbol se ponde- 
ran por medio de probabilidades. Utilizaremos los datos de la tabla 5-1 para mostrar la cons- 
trucción de un diagrama de árbol. 

1 . Para construir un diagrama de árbol, comenzamos dibujando un punto grueso a la izquier- 
da para representar la raíz del árbol (vea gráfica 5-2). 

2. En este problema, dos ramas principales salen de la raíz: la rama superior representa el 
evento “permanecería” y la rama inferior el evento “no permanecería”. Sus probabilidades 
se anotan sobre las ramas, en este caso, 120/200 y 80/200. Estas probabilidades también 
se denotan P{Aj) y P(A 2 ). 

3. De cada una de las ramas principales salen cuatro ramas, las cuales representan el tiem- 
po de servicio: menos de 1 año, 1 a 5 años, 6 a 10 años y más de 10 años. Las proba- 
bilidades condicionales de la rama superior del árbol, 10/120, 30/120, 5/120, etc., se 
anotan en las ramas adecuadas, que son P(B- I \A- Í ), P(B 2 \A,), P{B 3 \A,) y P{B 4 \A,), en las 
cuales B- , se refiere a menos de 1 año de servicio; B 2 , a 1 a 5 años de servicio, 6 3 , a 6 a 
1 0 años de servicio y B 4 , a más de 1 0 años. En seguida, anotamos las probabilidades con- 
dicionales en la rama inferior. 

4. Por último, las probabilidades conjuntas relativas al hecho de que los eventos A, y B, o los 
eventos A 2 y B, ocurrirán al mismo tiempo aparecen al lado derecho. Por ejemplo, de 
acuerdo con la fórmula (5-6), la probabilidad conjunta de seleccionar al azar a un ejecuti- 
vo que permanecería en la compañía y que tenga más de 1 año de servicio es: 

P[A, y B-,) = P(A,)P(B,\A,) = (H)(^) = 0.05 

Como las probabilidades conjuntas representan todos los posibles resultados (per- 
manecería, 6 a 10 años de servicio, no permanecería, más de 10 años de servicio, etc.), 
deben sumar 1 .00 (vea gráfica 5-2). 
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GRAFICA 5-2 Diag rama de árbol que muestra la lealtad y los años de servicio 


r 


Autoevaluación 


5-8 



Considere una encuesta a algunos consumidores relacionada con la cantidad relativa de visitas que 
hacen a una tienda Sears (con frecuencia, en ocasiones o nunca) y con ei hecho de que la tienda se 
ubique en un lugar conveniente (sí y no). Cuando las variables son de escala nominal, tal como 
estos datos, por lo general los resultados se resumen en una tabla de contingencias. 



Lugar conveniente 


Visitas 

Si 

No 

Total 

Con frecuencia 

60 

20 

80 

En ocasiones 

25 

35 

60 

Nunca 

5 

50 

55 


90 

105 

195 


a) El número de visitas y la ubicación en un lugar conveniente, ¿son variables independientes? 

¿Por qué razón? Interprete su conclusión. 
tí) Dibuje un diagrama de árbol y determine las probabilidades conjuntas. 
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Ejercicios 

23. Suponga que P(A) = .40 y P(B\A) = .30. ¿Cuál es la probabilidad conjunta de A y 6? 

24. Suponga que P(XJ = .75 y P(Y 2 \X 1 ) = .40. ¿Cuál es la probabilidad conjunta de X-, y Y 2 7 

25. Un banco local informa que 80% de sus clientes tiene cuenta de cheques; 60% tiene cuenta de 
ahorros y 50% cuenta con ambas. Si se elige un cliente al azar, ¿cuál es la probabilidad de que el 
cliente tenga ya sea una cuenta de cheques o una cuenta de ahorros? ¿Cuál es la probabilidad de 
que el cliente no tenga una cuenta de cheques ni una de ahorros? 

26. All Seasons Plumbing tiene dos camiones de servicio que se descomponen con frecuencia. Si la 
probabilidad de que el primer camión esté disponible es de 0.75, la probabilidad de que el segun- 
do esté disponible es de 0.50 y la probabilidad de que ambos estén disponibles es de 0.30, ¿cuál 
es la probabilidad de que ningún camión se encuentre disponible? 

27. Observe la siguiente tabla. 


Segundo evento 

4 

Primer evento 

A, 


Total 


2 

1 

3 

6 

B 2 

1 

2 

1 

4 

Total 

3 

3 

4 

10 


a) Determine P[A-¡). 

b) Estime P(B^ | X\ 2 ). 

c) Aproxime P(S 2 y A 3 ). 

28. Clean-brush Products envió por accidente tres cepillos dentales eléctricos defectuosos a una far- 
macia, además de 17 sin defectos. 

a) ¿Cuál es la probabilidad de que los primeros dos cepillos eléctricos vendidos no sean devuel- 
tos a la farmacia por estar defectuosos? 

b) ¿De que los primeros dos cepillos eléctricos vendidos no estén defectuosos? 

29. Cada vendedor de Puchett, Sheets, and Hogan Insurance Agency recibe una calificación debajo 
del promedio, promedio y por encima del promedio en lo que se refiere a sus habilidades en ven- 
tas. A cada vendedor también se le califica por su potencial para progresar: regular, bueno o exce- 
lente. La siguiente tabla muestra una clasificación cruzada de estas características de personali- 
dad de los 500 empleados. 


Habilidades en ventas 

Potencial para progresar 

Regular 

Bueno 

Excelente 

Debajo del promedio 

16 

12 

22 

Promedio 

45 

60 

45 

Por encima del promedio 

93 

72 

135 


a) ¿Qué nombre recibe esta tabla? 

b) ¿Cuál es la probabilidad de que una persona elegida al azar tenga una habilidad para las ven- 
tas con calificación por encima del promedio y un excelente potencial para progresar? 

c) Construya un diagrama de árbol que muestre las probabilidades, probabilidades condicionales 
y probabilidades conjuntas. 

30. Un inversionista cuenta con tres acciones ordinarias. Cada una de ellas, independiente de las 
demás, tiene la misma probabilidad de: 1) incrementar su valor; 2) bajar su valor; 3) permanecer 
con el mismo valor. Elabore una lista de los posibles resultados de este experimento. Calcule la 
probabilidad de que por lo menos dos de las acciones aumenten de valor. 

31. La junta directiva de una pequeña compañía consta de cinco personas. Tres de ellas son líderes 
fuertes. Si compran una idea, toda la junta estará de acuerdo. El resto de los miembros débiles no 
tiene influencia alguna. Se programa a tres vendedores, uno tras otro, para que lleven a cabo una 
presentación frente a un miembro de la junta que el vendedor elija. Los vendedores son convin- 
centes, aunque no saben quiénes son los líderes fuertes. Sin embargo, ellos se enterarán a quién 
le habló el vendedor anterior. El primer vendedor que encuentre a un líder fuerte ganará en la pre- 
sentación. ¿Tienen los tres vendedores las mismas posibilidades de ganar en la presentación? Si 
no es así, determine las probabilidades respectivas de ganar. 
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OA8 Calcular probabilida- 
des con base en el teorema 
de Bayes. 



Estadística en acción 

Un estudio reciente de la 
National Collegiate 
Athletic Association 
(NCAA) informó que de 
150 000 muchachos de los 
últimos cursos de la escue- 
la secundaria que juegan 
en su equipo de basquet- 
bol, 64 formarían un equi- 
po profesional. En otras 
palabras, las posibilidades 
de que un jugador de bas- 
quetbol de los últimos cur- 
sos de la escuela secunda- 
ria forme parte de un equi- 
po profesional son de 1 en 
2 344. De acuerdo con el 
mismo estudio: 

1. Las posibilidades de que 
un jugador de basquet- 
bol de los últimos cur- 
sos de la escuela secun- 
daria juegue en alguna 
universidad son de alre- 
dedor de 1 en 40. 

2. Las posibilidades de que 
un chico de los últimos 
cursos de la escuela 
secundaria juegue bas- 
quetbol universitario 
como estudiante de los 
últimos cursos de la uni- 
versidad son de 1 en 60. 

3. Si usted juega basquet- 
bol como estudiante 

de los últimos cursos de 
la universidad, las posi- 
bilidades de formar 


parte de un equipo pro- 
fesional son de alrede- 
dor de 1 en 37.5. 



32. Si pregunta a tres extraños las fechas de sus cumpleaños, ¿cuál es la probabilidad de que a) todos 
hayan nacido el miércoles; b) todos hayan nacido en diferentes días de la semana; c) todos hayan 
nacido el sábado? 


5.7 Teorema de Bayes 

En el siglo xvm, el reverendo Thomas Bayes, un ministro presbiteriano inglés, planteó esta pre- 
gunta: ¿Dios realmente existe? Dado su interés en las matemáticas, intentó crear una fórmula 
para llegar a la probabilidad de que Dios existiera sobre la base de la evidencia de que dispo- 
nía en la Tierra. Más tarde, Pierre-Simon Laplace perfeccionó el trabajo de Bayes y le dio el 
nombre de teorema de Bayes. De una forma entendlble, el teorema de Bayes es el siguiente: 


r 


TEOREMA DE BAYES 


v 


míe) 


P(A)P(6|A) 

p(A)P(elA) + p(a 2 )P(b\a 2 ) 


(5-7) 


En la fórmula (5-7) los eventos A Y A son mutuamente excluyentes y colectivamente exhaus- 
tivos, y A se refiere al evento A 0 a A 2 . De ahí que en este caso A y A 2 sean complementos. 
El significado de los símbolos utilizados se ¡lustra en el siguiente ejemplo. 

Suponga que 5% de la población de Limen, un país ficticio del Tercer mundo, tiene una 
enfermedad propia del país. Sea A el evento “padece la enfermedad” y A 2 e\ evento “no pade- 
ce la enfermedad”. Por lo tanto, si selecciona al azar a una persona de Umen, la probabilidad 
de que el individuo elegido padezca la enfermedad es de 0.05 o P(A) = 0.05. Esta probabili- 
dad, P (A) = P( padece la enfermedad) = 0.05, recibe el nombre de probabilidad a priori. Se 
le da este nombre, porque la probabilidad se asigna antes de obtener los datos empíricos. 


0 


PROBABILIDAD A PRIORI Probabilidad basada en el nivel de información actual. 


3 


Por ende, la probabilidad a priori de que una persona no padezca la enfermedad es de 0.95, 
o P(A) = 0.95, que se calcula restando 1 - 0.05. 

Existe una técnica de diagnóstico para detectar la enfermedad, pero no es muy precisa. 
Sea B el evento “la prueba revela la presencia de la enfermedad”. Suponga que la evidencia 
histórica muestra que si una persona padece realmente la enfermedad, la probabilidad de que 
la prueba indique su presencia es de 0.90. De acuerdo con las definiciones de probabilidad 
condicional que se establecieron en el capítulo, dicho enunciado se expresa de la siguiente 
manera: 


P(B|A) = -90 

Suponga la probabilidad de que la prueba indique la presencia de la enfermedad en una per- 
sona que en realidad no la padece es de 0.15. 

P(B|A) = -15 

Elija al azar a una persona de Umen y aplique la prueba. Los resultados indican que la 
enfermedad está presente. ¿Cuál es la probabilidad de que la persona en realidad padezca 
la enfermedad? Lo que desea saber, en forma simbólica, es P(A|S), que se interpreta de la 
siguiente manera: P(padece la enfermedad | la prueba resulta positiva). La probabilidad 
P(A|S) recibe el nombre de probabilidad a posteríorí. 


Q 


3 


PROBABILIDAD A POSTERIORI Probabilidad revisada a partir de información adicional. 


Con la ayuda del teorema de Bayes, fórmula (5-7), determine la probabilidad a posteriori : 



168 


CAPÍTULO 5 Estudio de los conceptos de la probabilidad 


P(A le) = P(^)P(B\A,) 

v 1 ' P(Ai)P(B\Ai) + P(A 2 )P(B\A 2 ) 

= (.05)(.90) = ,0450 = 

(,05)(.90) + (,95)(.15) .1875 ' 

De esta forma, la probabilidad de que una persona padezca la enfermedad, dado que la prue- 
ba fue positiva, es de 0.24. ¿Cómo interpreta el resultado? Si selecciona al azar a una perso- 
na de la población, la probabilidad de que se encuentre enferma es de 0.05. Si se le somete 
a la prueba y resulta positiva, la probabilidad de que la persona padezca realmente la enfer- 
medad se incrementa cinco veces, de 0.05 a 0.24. 

En el problema anterior sólo había dos eventos mutuamente excluyentes y colectivamen- 
te exhaustivos A-, y A 2 . Si hay n eventos A-, A 2 , ..., A n , el teorema de Bayes, fórmula (5-7), se 
transforma en 


míe) 


m,)P(elA) 

P(A)P(B|A) + P(A 2 )P(B\A 2 ) +■■■+ P(A n )P(B | A n ) 


Con la notación anterior, los cálculos del problema de Limen se resumen en la siguiente 
tabla: 


Evento, 

4 

Probabilidad 
a priori, 

m 

Probabilidad 

condicional, 

0(44) 

Probabilidad 

conjunta, 

0(4 V 4 

Probabilidad 
a posterior i, 

0(4 B) 

Padece la enfermedad, A 


.05 

.90 


.0450 

.0450/.1 875 = .24 

No padece la enfermedad, 4 

2 

.95 

.15 


.1425 

. 1 425/.1 875 = .76 





m = 

.1875 

1.00 


A continuación, otro ejemplo del teorema de Bayes. 


Cjemplo 


Solución 


Un fabricante de reproductores de DVD compra un microchip en particular, 
denominado LS-24, a tres proveedores: Hall Electronics, Schuller 
Sales y Crawford Components. Treinta por ciento de los chips 
LS-24 se le compran a Hall Electronics; 20%, a Schuller 
Sales y el restante 50%, a Crawford Components. El 
fabricante cuenta con amplios historiales sobre los tres 
proveedores y sabe que 3% de los chips LS-24 de Hall 
Electronics tiene defectos, 5% de los de Schuller Sales 
también y 4% de los que vende Crawford Components son 
defectuosos. 

Cuando los chips LS-24 se reciben, se les coloca directa- 
mente en un depósito y no se inspeccionan ni se identifican 
con el nombre del proveedor. Un trabajador selecciona un chip 
para instalarlo en un reproductor de DVD y lo encuentra defec- 
tuoso. ¿Cuál es la probabilidad de que lo haya fabricado Schuller 
Sales? 

Como primer paso, resuma parte de la información incluida en el enunciado del problema. 

Hay tres eventos mutuamente excluyentes y colectivamente exhaustivos, es decir, tres 
proveedores: 



A 

A 2 

A3 


el LS-24 se le compró a Hall Electronics; 
el LS-24 se le compró a Schuller Sales; 
el LS-24 se le compró a Crawford Components. 
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Las probabilidades a priori son: 

P(A ^ = .30 La probabilidad de que Hall Electronics haya fabricado el LS-24. 

P(/4 2 ) = .20 La probabilidad de que Schuller Sales haya fabricado el LS-24. 

P(/4 3 ) = .50 La probabilidad de que Crawford Components haya fabricado el LS-24. 

La información adicional es la siguiente: 

B-i'. el LS-24 parece defectuoso; o 

B 2 : el LS-24 no parece defectuoso. 

Se dan las siguientes probabilidades condicionales. 

P(B 1 |/A 1 ) = .03 La probabilidad de que un chip LS-24 fabricado por Hall Electronics 
se encuentre defectuoso. 

P(B 1 1/4 2 ) = .05 La probabilidad de que un chip LS-24 fabricado por Schuller Sales se 
encuentre defectuoso. 

P(B 1 |v4 3 ) = .04 La probabilidad de que un chip LS-24 fabricado por Crawford Com- 
ponents se encuentre defectuoso. 

Se selecciona un chip del depósito. Como el fabricante no identificó los chips, no se está 
seguro de qué proveedor los fabricó. Desea determinar la probabilidad de que el chip 
defectuoso haya sido fabricado por Schuller Sales. La probabilidad se expresa como 
P(A>lBi)- 

Observe el registro de calidad de Schuller. Es el peor de los tres proveedores. Ahora que 
ha encontrado un chip LS-24 defectuoso, sospecha que P(A 2 |B 1 ) es mayor que P(A 2 ). Es decir, 
la probabilidad revisada es mayor que 0.20. Pero, ¿cuán mayor? El teorema de Bayes ofrece la 
respuesta. Como primer paso considere el diagrama de árbol de la gráfica 5-3. 

Los eventos son dependientes, así que la probabilidad a priori de la primera rama se mul- 
tiplica por la probabilidad condicional de la segunda para obtener la probabilidad conjunta. La 
probabilidad conjunta figura en la última columna de la gráfica 5-3. Para construir el diagrama 
de árbol de la gráfica 5-3, se empleó una sucesión de etapas que iban del proveedor hacia la 
determinación de si el chip era o no aceptable. 

Lo que necesita hacer es invertir el proceso. Esto es, en lugar de desplazarse de izquier- 
da a derecha en la gráfica 5-3, necesita hacerlo de derecha a izquierda. Tiene un chip defec- 
tuoso, y quiere determinar la probabilidad de que se le haya comprado a Schuller Sales. ¿Cómo 
se consigue este objetivo? Primero considere las probabilidades conjuntas como frecuencias 
relativas de entre 1 000 casos. Por ejemplo, la posibilidad de que Hall Electronics haya fabrica- 
do un chip LS-24 defectuoso es de 0.009. Así que de 1 000 casos es de esperar 9 chips defec- 
tuosos fabricados por Hall Electronics. Observe que en 39 de 1 000 casos el chip LS-24 selec- 
cionado será defectuoso, lo cual se calcula sumando 9 + 10 + 20. De estos 39 chips defec- 
tuosos, 10 fueron fabricados por Schuller and Sales. Por consiguiente, la probabilidad de que 
se le haya comprado un chip LS-24 es de 10/39 = 0.2564. Ha determinado la probabilidad revi- 
sada de P(A 2 \Bi). Antes de encontrar el chip defectuoso, la probabilidad de que se le haya 
comprado a Schuller Sales era de 0.20. Esta posibilidad se ha incrementado a 0.2564. 

Esta información se resume en la siguiente tabla: 


Evento, 

4 

Probabilidad 

a priori, 

P(A) 

Probabilidad 

condicional, 

PÍA 14) 

Probabilidad 

conjunta, 

P(4yBi) 

Probabilidad 
a posteriori, 
P(A,\B ,) 

Hall 

.30 

.03 

.009 

.009/. 039 = .2308 

Schuller 

.20 

.05 

.010 

.010/. 039 = .2564 

Crawford 

.50 

.04 

.020 

.020/. 039 = .5128 




P(B,) = .039 

1.0000 
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Probabilidad conjunta 



Probabilidad condicional 





Probabilidad a priori 

B, = Defectuoso 





P(BM) = . 03 -• 


P{A\ y Si) 

= P(A)P(B 1 I4 1 ) 






= (.30) (.03) 

= .009 

[ 

—3 . — B, = En buen estado 







P (A y b 2 ) 

= P(A 1 )P(B 2 I4 1 ) 


4 1 = Hall 

P (B 2 \AJ = . 97 



= (.30) (.97) 

= .291 

P{A¡) = .30 







B 1 = Defectuoso 

P(A 2 y B4 

= P(A 2 )P(B 1 I4 2 ) 


A 2 = Schuller 

P(B 1 I4 2 ) = .05 4-» 



= (.20) (.05) 

= .010 

P(4 2 )-.20 

— — r- — B, = En buen estado 







p (a 2 y B 2 ) 

= P(4 2 )P(B 2 I4 2 ) 



P(B 2 \A 2 ) = . 95 



= (.20) (.95) 

= .190 

4 3 = Crawford 

B t = Defectuc 

)S0 

P(4 3 yBi) 

= P(A 3 )P(B 1 I4 3 ) 


P(4 3 ) = .50 

^(6,1^3) = — • 



= (.50) (.04) 

= .020 


—— l B 2 = En buen estado 







P (4 3 y B 2 ) 

= P(A 3 )P(B 2 I4 3 ) 



P(B 2 I A 3 ) = .96 



= (.50) (.96) 

= .480 





Total 1 .000 


GRÁFICA 5-3 


Diagrama de árbol del problema de la fabricación de reproductores de DVD 


La probabilidad de que el chip LS-24 defectuoso provenga de Schuller Sales puede deter- 
minarse formalmente mediante el teorema de Bayes. Calcule P(A 2 \B- [ ), en la que A z se refiere 
a Schuller Sales y B-¡ al hecho de que el chip LS-24 estaba defectuoso: 


P(A 2 \B,) 


P(A 2 )P(B, \a 2 ) 

P(A,)P(B, | A,) + P(A 2 )P(B 1 \A Z ) + P(A 3 )(B, \A s ) 


(-20)(.05) 

(,30)(.03) + (,20)(.05) + (,50)(.04) 


.010 

TD39 


= .2564 


Es el mismo resultado que se obtuvo en la gráfica 5-3 y en la tabla de probabilidad condi- 
cional. 



Considere el ejemplo anterior junto con la solución. 

a) Diseñe una fórmula para determinar la probabilidad de que la pieza seleccionada provenga de 
Crawford Components, dado que se trataba de un chip en buenas condiciones. 

b) Calcule la probabilidad con el teorema de Bayes. 


comed: 


Ejercicios 

33. P(Ai) = .60, P[A 2 ) = .40, PjB-jA-,) = .05 y P(B 1 1/\ 2 ) = .10. Aplique el teorema de Bayes para deter- 
minar P(A 1 ¡B.,). 

34. P(AJ=. 20, P{A 2 ) = .40, P(A 3 ) = .40, P(B- l \A- [ ) = .25, P(B^A 2 ) = .05 y P(B 1 |A 3 ) = .1 0. Aplique el teo- 
rema de Bayes para determinar P(A 3 \B^). 
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35. El equipo de béisbol de los Gatos Salvajes de Ludlow, un equipo de las ligas menores de la orga- 
nización de los Indios de Cleveland, juega 70% de sus partidos por la noche y 30% de día. El equi- 
po gana 50% de los juegos nocturnos y 90% de los diurnos. De acuerdo con el periódico de hoy, 
ganaron el día de ayer. ¿Cuál es la probabilidad de que el partido se haya jugado de noche? 

36. La doctora Stallter ha enseñado estadística básica por varios años. Ella sabe que 80% de los estu- 
diantes terminará los problemas asignados. También que entre quienes hacen sus tareas, 90% 
pasará el curso. Entre los que no hacen su tarea, 60% pasará el curso. Mike Fishbaugh cursó esta- 
dística el semestre pasado con la doctora Stallter y pasó. ¿Cuál es la probabilidad de que haya 
terminado sus tareas? 

37. El departamento de crédito de Lion’s Department Store en Anaheim, California, informó que 30% 
de las ventas se paga con efectivo o con cheque; 30% con tarjeta de crédito, y 40% con tarjeta 
de débito. Veinte por ciento de las compras con efectivo o cheque, 90% de las compras con tar- 
jeta de crédito y 60% de las compras con tarjeta de débito son por más de $50. La señora Tina 
Stevens acaba de comprar un vestido nuevo que le costó $120. ¿Cuál es la probabilidad de que 
haya pagado en efectivo o con cheque? 

38. Una cuarta parte de los residentes de Burning Ridge Estates dejan las puertas de sus cocheras 
abiertas cuando salen de su hogar. El jefe de la policía de la localidad calcula que a 5% de las 
cocheras les robarán algo, pero sólo al 1 % de las cocheras con puertas cerradas les robarán algo. 
Si roban una cochera, ¿cuál es la probabilidad de que se hayan dejado las puertas abiertas? 

5.8 Principios de conteo 

Si la cantidad de posibles resultados de un experimento es pequeña, resulta relativamente fácil 

contarlas. Por ejemplo, existen seis posibles resultados del lanzamiento de un dado, a saber: 


OA9 Determinar el número 
de resultados por medio del 
principio apropiado de 
conteo. 


Fórmula de la multiplicación 

Primero la fórmula de la multiplicación. 


0QSD0I 

Sin embargo, si hay un número muy grande de resultados, tal como el número de caras y cru- 
ces en un experimento con 10 lanzamientos de una moneda, sería tedioso contar todas las 
posibilidades. Todos podrían ser caras, una cruz y nueve caras, dos caras y ocho cruces, y así 
sucesivamente. Para facilitar la cuenta, se analizarán tres fórmulas para contar: la fórmula de 
la multiplicación (no se confunda con la regla de la multiplicación descrita en el capítulo), la 
fórmula de las permutaciones y la fórmula de las combinaciones. 


FÓRMULA DE LA MULTIPLICACIÓN Si hay m formas de hacer una cosa y n formas de hacer otra 
cosa, hay m x n formas de hacer ambas cosas. 


En términos de la fórmula: 


r 


FORMULA DE LA MULTIPLICACION 


Número total de disposiciones = (m)(n) 


(5 


- 8 ) 


Esta fórmula se puede extender a más de dos eventos. En el caso de tres eventos m, n y o: 
Número total de disposiciones = ( m)(n)(o ) 


Cjemplo 


Un distribuidor de automóviles quiere anunciar que por $29 999 usted puede comprar un con- 
vertible, un sedán de dos puertas o un modelo de cuatro puertas y elegir entre riñes de rayos 
o planos. ¿Cuántas disposiciones de modelos y riñes puede ofrecer el distribuidor? 

Por supuesto, el distribuidor podría determinar el número total de disposiciones haciendo un 
diagrama y contando. Hay seis. 


Solución 
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Convertible 
con riñes de rayos 



Dos puertas 
con riñes de rayos 



Cuatro puertas 
con riñes de rayos 



Convertible 
con riñes planos 



Dos puertas 
con riñes planos 



Cuatro puertas 
con riñes planos 



Mediante la fórmula de la multiplicación se verifica el resultado (en cuyo caso m es el 
número de modelos y n el tipo de rin). De acuerdo con la fórmula (5-8): 

Número total de posibles disposiciones = (m)(n)= (3)(2) = 6 


No resultó difícil contar todas las posibles combinaciones de modelos y riñes en este 
ejemplo. Sin embargo, supongamos que el distribuidor decidió ofrecer ocho modelos y seis 
tipos de riñes. Resultaría tedioso representar y contar todas las posibles alternativas. Más 
bien, se puede aplicar la fórmula de la multiplicación. En este caso, hay (m)(n)= (8)(6) = 48 
posibles disposiciones. 

Observe en el ejemplo que, en la fórmula de la multiplicación, había dos o más agolpa- 
mientos de los cuales usted hizo selecciones. El distribuidor, por ejemplo, ofreció una variedad 
de modelos y de riñes para elegir. Si un constructor de casas le ofrece cuatro diferentes esti- 
los de exteriores y tres modelos de interiores, se aplicaría la fórmula de la multiplicación para 
determinar cuántas combinaciones son posibles. Hay 12 posibilidades. 



2 . 


Women’s Shopping Network ofrece suéteres y pantalones para dama por televisión de cable. 
Los suéteres y pantalones se ofrecen en colores coordinados. Si los suéteres se encuentran 
disponibles en cinco colores y los pantalones en cuatro colores, ¿cuántos diferentes conjun- 
tos se pueden anunciar? 

Pioneer fabrica tres modelos de receptores estereofónicos, dos reproductores MP3, cuatro boci- 
nas y tres carruseles de CD. Cuando se venden juntos, los cuatro tipos de componentes forman 
un sistema. ¿Cuántos diferentes sistemas puede ofrecer la empresa de electrónica? 


Fórmula de las permutaciones 

Como se ve, la fórmula de la multiplicación se aplica para determinar el número de posibles 
disposiciones de dos o más grupos. La fórmula de las permutaciones se aplica para deter- 
minar el número posible de disposiciones cuando sólo hay un grupo de objetos. He aquí algu- 
nos ejemplos de esta clase de problemas. 

• Tres piezas electrónicas se van a montar en una unidad conectable a un aparato de tele- 
visión. Las piezas se pueden montar en cualquier orden. La pregunta es: ¿de cuántas 
formas pueden montarse tres partes? 

• Un operador de máquinas debe llevar a cabo cuatro verificaciones de seguridad antes 
de hacer arrancar su máquina. No importa el orden en que realice las verificaciones. 
¿De cuántas formas puede hacerlas? 
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Un orden para el primer ejemplo sería: primero el transistor, en seguida las LED y en tercer 
lugar el sintetizados A esta distribución se le conoce como permutación. 


PERMUTACIÓN Cualquier distribución de r objetos seleccionados de un solo grupo de n posi- 
bles objetos. 


Observe que las distribuciones a b c y b a c son permutaciones diferentes. La fórmula para 
contar el número total de diferentes permutaciones es: 


FÓRMULA DE LAS PERMUTACIONES 


P = 


n\ 

(n ~ r)\ 


(5-9) 


y 


donde: 

n representa el total de objetos; 
r representa el total de objetos seleccionados. 


Antes de resolver los dos problemas planteados, note que en las permutaciones y las 
combinaciones (que se plantean en breve) se emplea la notación denominada n factorial. Ésta 
se representa como n! y significa el producto de n(n - 1)(n - 2 )(n - 3) (1). Por ejemplo, 

5! = 5 • 4 • 3 • 2 • 1 =120. 

Muchas calculadoras tienen una tecla con x!, que ejecuta el cálculo. Ahorrará mucho tiem- 
po. Por ejemplo, la calculadora Texas Instrument TI-36X tiene la siguiente tecla: x! 



Es la tercera función, así que revise el manual del usuario o internet para leer las instruc- 
ciones. 

La notación factorial se puede eliminar cuando los mismos números aparecen tanto en el 
numerador como en el denominador, como se muestra a continuación: 

613! _ 6 • 5 • 4 - 3- 2 - T(3 • 2 • 1) _ Hon 
4! 4 • 3 • 2 • X 

Por definición, cero factorial, que se escribe 0!, es 1. Es decir que 0! = 1. 


Cjemplo 

Solución 


Respecto del grupo de tres piezas electrónicas que se van a montar en cualquier orden, ¿de 
cuántas formas se pueden montar? 

Hay tres piezas electrónicas que van a montarse, así que n = 3. Como las tres se van a inser- 
tar en la unidad conectable, r = 3. De acuerdo con la fórmula (5-9), el resultado es: 

n\ _ 3! 3! 3! 

n r ~ (n - r)\ ~ (3 - 3)1 ~ 0! ~ 1 

Podemos verificar el número de permutaciones que obtuvimos con la fórmula de las per- 
mutaciones. Determinamos cuántos espacios hay que llenar y las posibilidades para cada 
espacio. En el problema de las tres piezas electrónicas, hay tres lugares en la unidad conecta- 
ble para las tres piezas. Hay tres posibilidades para el primer lugar, dos para el segundo (una 
se ha agotado) y una para el tercero: 

(3)(2)(1) = 6 permutaciones 

Las seis formas en que las tres piezas electrónicas, representadas con las letras A, B, C, se 
pueden ordenar, es: 

ABC BAC CAB ACB BCA CBA 



174 


CAPÍTULO 5 Estudio de los conceptos de la probabilidad 


En el ejemplo anterior, seleccionamos y distribuimos todos los objetos, es decir que n = r. En 
muchos casos, sólo se seleccionan algunos objetos y se ordenan tomándolos de entre los n 
posibles objetos. En el siguiente ejemplo explicamos los detalles de este caso. 


r 

Cjemplo 

Betts Machine Shop, Inc., cuenta con ocho tornos, aunque sólo hay tres espacios disponibles 
en el área de producción para las máquinas. ¿De cuántas maneras se pueden distribuir las 


ocho máquinas en los tres espacios disponibles? 

Solución 

Hay ocho posibilidades para el primer espacio disponible en el área de producción, siete para 
el segundo espacio (una se ha agotado) y seis para el tercer espacio. Por consiguiente: 


( 8 ) (7) ( 6 ) = 336, 


es decir, hay un total de 336 diferentes distribuciones posibles. Este resultado también podría 
obtenerse aplicando la fórmula (5-9). Si n = 8 máquinas y r = 3 espacios disponibles, la fórmu- 
la da como resultado 


r n\ _ 8 ! 8 ! (8)(7)(6)5f _ 

n r (n - r)\ (8 - 3)! 5! Si 


Fórmula de las combinaciones 

Si el orden de los objetos seleccionados no es importante, cualquier selección se denomina 
combinación. La fórmula para contar el número de r combinaciones de objetos de un conjun- 
to de n objetos es: 


FÓRMULA DE LAS COMBINACIONES 


C = 


n! 

r\(n - r)\ 


(5-10) 


y 


Por ejemplo, si los ejecutivos Able, Baker y Chauncy van a ser elegidos para formar un comi- 
té de negociación de una fusión, sólo existe una posible combinación con estos tres ejecuti- 
vos; el comité formado por Able, Baker y Chauncy es el mismo comité que el que forman 
Baker, Chauncy y Able. De acuerdo con la fórmula de las combinaciones: 

3 ' 2 ' 1 =1 

n r r\(n - r)l 3 • 2 • 1(1) 


r 

Cjemplo 

Se ha dado al departamento de marketing la tarea de designar códigos de colores a las 42 dife- 
rentes líneas de discos compactos que vende Goody Records. Tres colores se van a utilizar 


para cada CD; ahora bien, una combinación de tres colores para un CD no se puede reorde- 
nar para identificar un CD diferente. Esto significa que si se utilizaron el verde, amarillo y viole- 
ta para identificar una línea, entonces el amarillo, verde y violeta (o cualquier otra combinación 
de estos tres colores) no se puede emplear para identificar otra línea. ¿Serían adecuados siete 
colores tomados de tres en tres para codificar las 42 líneas? 

Solución 

De acuerdo con la fórmula (5-10), hay 35 combinaciones, que se determinan mediante 

„ n\ 7! 7! 

C — — — — 35 

7 3 r!(n - r)\ 3!(7 - 3)! 3!4! 

Los siete colores tomados de tres en tres (es decir, tres colores para una línea) no serían ade- 
cuados para codificar las 42 líneas, ya que sólo proporcionarían 35 combinaciones. Ocho colo- 
res tomados de tres en tres darían 56 combinaciones. Esto sería más que suficiente para codi- 
ficar las 42 diferentes líneas. 





5.8 Principios de conteo 
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Autoevaluación 5-11 



Cuando el número de permutaciones o combinaciones es grande, los cálculos son labo- 
riosos. El software de las computadoras y las calculadoras de mano tienen funciones para 
calcular estos números. A continuación aparece una captura de pantalla de Excel que contie- 
ne la ubicación de los ocho tornos en el área de producción de Betts Machine Shop, Inc. Hay 
un total de 336 distribuciones. 



En seguida aparece la captura de pantalla de los cuatro códigos de colores de Goody 
Records. Se eligen tres colores de entre siete posibles. El número de combinaciones posibles 
es de 35. 



1 . Un músico piensa escribir una escala basada sólo en cinco cuerdas: B bemol, C, D, E y G. Sin 
embargo, sólo tres de las cinco cuerdas se van a utilizar en sucesión, por ejemplo: C, B bemol 
y E. No se permiten repeticiones como B bemol, B bemol y E. 

a) ¿Cuántas permutaciones de las cinco cuerdas, tomadas de tres en tres, son posibles? 

b) De acuerdo con la fórmula (5-9), ¿cuántas permutaciones son posibles? 

2. Los 10 números del 0 al 9 se van a emplear en grupos de códigos de cuatro dígitos para identi- 
ficar una prenda. El código 1083 podría identificar una blusa azul, talla mediana; el grupo de 
código 2031 podría identificar unos pantalones talla 18, etc. No están permitidas las repeticio- 
nes de números. Es decir, el mismo número no se puede utilizar dos veces (o más) en una suce- 
sión completa. Por ejemplo, 2256, 2562 o 5559 no estarían permitidos. ¿Cuántos diferentes gru- 
pos de códigos se pueden asignar? 

3. En el ejemplo relacionado con Goody Records, concluyó que ocho colores tomados de tres en 
tres darían un total de 56 diferentes combinaciones. 

a) Aplique la fórmula (5-10) para demostrar que esto es verdadero. 

b) Como alternativa para codificar con colores las 42 diferentes líneas, se ha sugerido que sólo 
dos colores se coloquen en un disco. ¿Diez colores serían adecuados para codificar las 42 
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diferentes líneas? (De nuevo, se podría utilizar una sola vez una combinación de dos colo- 
res; es decir, si rosa y azul se utilizaron para codificar una línea, el azul y el rosa no se pue- 
den emplear para identificar otra línea.) 

4. En un juego de lotería se seleccionan al azar tres números de una tómbola de bolas numeradas 
del 1 al 50. 

a) ¿Cuántas permutaciones son posibles? 

b) ¿Cuántas combinaciones son posibles? 


comed 


Ejercicios 

39. Resuelva las siguientes operaciones: 

a) 401/35! 

b) 7 P 4 

c) 5 C 2 

40. Resuelva las siguientes operaciones: 

a) 201/17! 

b) 9P3 

c) 7 C 2 

41. Un encuestador seleccionó en forma aleatoria a 4 de 10 personas disponibles. ¿Cuántos diferen- 
tes grupos de 4 es posible formar? 

42. Un número telefónico consta de siete dígitos, los primeros tres representan el enlace. ¿Cuántos 
números telefónicos son posibles con el enlace 537? 

43. Una compañía de entregas rápidas debe incluir cinco ciudades en su ruta. ¿Cuántas diferentes 
rutas se pueden formar suponiendo que no importa el orden en que se incluyen las ciudades en la 
ruta? 

44. Una representante de la Environmental Protection Agency (EPA) piensa seleccionar muestras de 
10 terrenos. El director tiene 15 terrenos, de los cuales la representante puede recoger las mues- 
tras. ¿Cuántas diferentes muestras son posibles? 

45. Un encuestador nacional ha formulado 1 5 preguntas diseñadas para medir el desempeño del pre- 
sidente de Estados Unidos. El encuestador seleccionará 10 de las preguntas. ¿Cuántas distribu- 
ciones de las 10 preguntas se pueden formar tomando en cuenta el orden? 

46. Una compañía va a crear tres nuevas divisiones. Para dirigir cada una de ellas hay siete gerentes 
elegibles. ¿De cuántas formas se podrían elegir a los tres nuevos directores? Sugerencia: Asuma 
que la asignación de la división sí hace diferencia. 


Resumen del capítulo 

I. Una probabilidad es un valor entre 0 y 1, inclusive, que representa las posibilidades de que cierto 
evento ocurra. 

A. Un experimento es la observación de alguna actividad o el acto de tomar una medida. 

B. Un resultado es una consecuencia particular de un experimento. 

C. Un evento es la colección de uno o más resultados de un experimento. 

II. Existen tres definiciones de probabilidad. 

A. La definición clásica se aplica cuando un experimento generará n resultados igualmente po- 
sibles. 

B. La definición empírica se emplea cuando el número de veces que ocurre un evento se divide 
entre el número de observaciones. 

C. Una probabilidad subjetiva se basa en cualquier información disponible. 

III. Dos eventos son mutuamente excluyentes si como consecuencia de que uno de los dos sucede, el 
otro no puede ocurrir. 

IV. Los eventos son independientes si el hecho de que un evento suceda no influye en que el otro 
ocurra. 

V. Las reglas de la adición se refieren a la unión de eventos. 


Clave de pronunciación 
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Estadística en acción 

Las estadísticas guberna- 
mentales muestran que 
hay alrededor de 1.7 
muertes provocadas por 
accidentes automovilísti- 
cos por cada 100 000 000 
de millas recorridas. Si 
usted maneja 1 milla a la 
tienda para comprar un 
billete de lotería y en 
seguida regresa a casa, 
usted ha recorrido 2 
millas. Por consiguiente, 
la probabilidad de que 
usted se una a este grupo 
de estadísticas en sus 
siguientes 2 millas de 
viaje redondo es de 2 X 
1.7/100 000 000 = 
0.0000034. Esto también 
se expresa como una en 
29 411 765. Por lo tanto, 
si usted maneja a la tien- 
da a comprar su boleto, 
la probabilidad de morir 
(o matar a alguien) es 
más de 4 veces la proba- 
bilidad de que se saque 
la lotería, una posibilidad 
en 120 526 770. 
http://www. 
durangobill.com/ 
Powerball Odds.html 



A. La regla especial de la adición se aplica cuando los eventos son mutuamente excluyentes. 

PÍA o B) = PÍA) + P{B) (5-2) 

B. La regla general de la adición se aplica cuando los eventos no son mutuamente excluyentes. 

PÍA o B) = PÍA) + P(B) - P{A y B) (5-4) 

C. La regla del complemento se utiliza para determinar la probabilidad de un evento restando de 1 
la probabilidad de que el evento no suceda. 

PÍA) = 1 - P(~A) (5-3) 


VI. Las reglas de la multiplicación se refieren al producto de eventos. 

A. La regla especial de la multiplicación se refiere a eventos que son independientes. 

P(A yfi) = P{A)P(B) (5-5) 

B. La regla general de la multiplicación se aplica en eventos que no son independientes. 

PÍA y B) = P{A)P(B\A) (5-6) 


C. Una probabilidad conjunta es la posibilidad de que dos o más eventos sucedan al mismo 
tiempo. 

D. Una probabilidad condicional es la posibilidad de que un evento suceda, dado que otro evento 
ha sucedido. 

E. El teorema de Bayes es un método que consiste en revisar una probabilidad, dado que se ha 
logrado información adicional. En el caso de dos eventos mutuamente excluyentes y colectiva- 
mente exhaustivos, 


P(Ai\B) 


P(A,)P(B\AJ 

P(A,)P(B\A ,) + P(A 2 )P(B\A 2 ) 


(5-7) 


Vil. Existen tres reglas de conteo útiles para determinar el número de resultados de un experimento. 

A. La regla de la multiplicación establece que si hay m formas de que un evento suceda y n formas 
de que otro pueda suceder, entonces hay mn formas en que los dos eventos pueden suceder. 

Número de disposiciones = (m)(n) (5-8) 


B. Una permutación es un arreglo en el que el orden de los objetos seleccionados de un conjunto 
específico es importante. 


n 


p, = 


n! 

(n - r)\ 


(5-9) 


C. Una combinación es un arreglo en el que el orden de los objetos seleccionados de un conjunto 
específico no es importante. 


c = n ' 

" r r!(n - r)\ 


(5-10) 


Clave 

de pronunciación 


SÍMBOLO 

SIGNIFICADO 

PRONUNCIACIÓN 

P(A) 

Probabilidad de A 

P de A 

P(~A) 

Probabilidad de no A 

P de no A 

P{A y B) 

Probabilidad de A y B 

P de Ay B 

P{A o B) 

Probabilidad de A o B 

P de A o B 

P(A\B) 

Probabilidad de A dado que B ha ocurrido 

P de A, dado B 

n P r 

Permutación de n elementos seleccionados r a la vez 

Pnr 

r)Cr 

Combinación de n elementos seleccionados r a la vez 

Cnr 
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Ejercidos del copítulo 

47. El departamento de investigación de mercados de PepsiCo planea realizar una encuesta entre ado- 
lescentes sobre un refresco recién creado. A cada uno de ellos se le va a pedir que lo comparen 
con su refresco favorito. 

a) ¿En qué consiste ei experimento? 

b) ¿Cuál es uno de los eventos posibles? 

48. El número de veces que ocurrió un evento en el pasado se divide entre el número de veces que 
ocurre. ¿Cómo se llama este enfoque de la probabilidad? 

49. La probabilidad de que la causa y la cura de todo tipo de cáncer se descubran antes del año 2020 
es de 0.20. ¿Qué enfoque de la probabilidad ¡lustra este enunciado? 

50. Berdine’s Chicken Factory posee varias tiendas en el área del Hilton Head, Carolina del Sur. Al 
entrevistar a los candidatos para el puesto de mesero, al propietario le gustaría incluir información 
referente a la propina que un mesero espera ganar por cuenta (o nota). Un estudio de 500 cuen- 
tas recientes indicó que el mesero ganaba las siguientes propinas por turno de 8 horas. 


Propina 

Número 

$0 a $ 20 

200 

20 a 50 

100 

50 a 100 

75 

100 a 200 

75 

200 o más 

50 

Total 

500 


a) ¿Cuál es la probabilidad de que una propina sea de $200 o más? 

ib) Las categorías $0 a $20, $20 a $50, etc., ¿se consideran mutuamente excluyentes? 

c) Si las probabilidades relacionadas con cada resultado se sumaran, ¿cuál sería el total? 

d) ¿Cuál es la probabilidad de que una propina sea de $50? 

e) ¿De que una propina sea inferior a $200? 

51. Ganar en todas las carreras “Triple Corona” se considera la mayor hazaña de un caballo de carre- 
ras de pedigrí. Después de un exitoso Derby de Kentucky, Big Brown es favorito 1 a 2 para ganar 
las Apuestas de Preakness. 

a) Si Big Brown es favorito 1 a 2 para ganar las Apuestas de Belmont también, ¿cuál es la proba- 
bilidad de que gane la Triple Corona? 

b) ¿Cuáles tendrían que ser sus oportunidades para las Apuestas de Preakness para que sea una 
“apuesta segura” para ganar la Triple Corona? 

52. La primera carta de una baraja de 52 cartas es un rey. 

a) Si lo regresa a la baraja, ¿cuál es la probabilidad de sacar un rey en la segunda selección? 

b) Si no io regresa a la baraja, ¿cuál es la probabilidad de sacar un rey en la segunda selección? 

c) ¿Cuál es la probabilidad de seleccionar un rey en la primera carta que se toma de la baraja y 
otro rey en la segunda (suponiendo que el primer rey no fue reemplazado? 

53. Armeo, un fabricante de sistemas de semáforos, descubrió que, en las pruebas de vida acelera- 
da, 95% de los sistemas recién desarrollados duraban 3 años antes de descomponerse al cam- 
biar de señal. 

a) Si una ciudad comprara cuatro de estos sistemas, ¿cuál es la probabilidad de que los cuatro 
sistemas funcionen adecuadamente durante 3 años por lo menos? 

b) ¿Qué regla de la probabilidad se ejemplifica en este caso? 

c) Representando los cuatro sistemas con letras, escriba una ecuación para demostrar cómo llegó 
a la respuesta a). 

54. Observe el siguiente dibujo. 
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a) ¿Qué nombre recibe el dibujo? 

ib) ¿Qué regla de la probabilidad se ilustra? 

c) B representa el evento que se refiere a la selección de una familia que recibe prestaciones 
sociales. ¿A qué es igual P{B) + P(~B)? 

55 . En un programa de empleados que realizan prácticas de gerencia en Claremont Enterprises, 80% 
de ellos son mujeres y 20% hombres. Noventa por ciento de las mujeres fue a la universidad, así 
como 78% de los hombres. 

a) Al azar se elige a un empleado que realiza prácticas de gerencia. ¿Cuál es la probabilidad de 
que la persona seleccionada sea una mujer que no asistió a la universidad? 

b) ¿El género y la asistencia a la universidad son independientes? ¿Por qué? 

c) Construya un diagrama de árbol que muestre las probabilidades condicionales y probabilida- 
des conjuntas. 

d) ¿Las probabilidades conjuntas suman 1.00? ¿Por qué? 

56. Suponga que la probabilidad de que cualquier vuelo de Northwest Airlines llegue 15 minutos des- 
pués de la hora programada es de 0.90. Seleccione cuatro vuelos de ayer para estudiarlos. 

a) ¿Cuál es la probabilidad de que los cuatro vuelos seleccionados lleguen 15 minutos después 
de la hora programada? 

b) ¿De que ninguno de los vuelos seleccionados llegue 15 minutos después de la hora programa- 
da? 

c) ¿De que por lo menos uno de los vuelos seleccionados no llegue 15 minutos después de la 
hora programada? 

57 . Kiddie Carts International tiene 100 empleados. Cincuenta y siete de ellos son trabajadores de la 
producción, 40 son supervisores, 2 son secretarias y el empleado que queda es el presidente. 
Suponga que selecciona un empleado. 

a) ¿Cuál es la probabilidad de que el empleado seleccionado sea un trabajador de producción? 
Jb) ¿Cuál es la probabilidad de que el empleado seleccionado sea un trabajador de producción o 
un supervisor? 

c) Respecto del inciso b), ¿estos eventos son mutuamente excluyentes? 

d) ¿Cuál es la probabilidad de que el empleado seleccionado no sea trabajador de la construc- 
ción ni supervisor? 

58 . Joe Mauer, de los Gemelos de Minnesota, tuvo el promedio de bateo más alto en la temporada 
2009 de la liga mayor de béisbol. Su promedio fue de 0.365. Así que suponga que la probabilidad 
de conectar un hit es de 0.365 en cada turno al bate. En cierto juego en particular, suponga que 
bateó tres veces. 

a) ¿Qué tipo de probabilidad constituye este ejemplo? 

b) ¿Cuál es la probabilidad de conectar tres hits en un juego? 

c) ¿De que no conecte ningún hit en un juego? 

d) ¿De conectar por lo menos un hit? 

59 . Quedan cuatro equipos deportivos en una competencia de eliminatorias. Si un equipo resulta favo- 
recido en el marcador de la semifinal por probabilidades de 2 a 1 , y otro resulta favorecido en su 
partido por probabilidades de 3 a 1, ¿cuál es la probabilidad de que: 

a) ambos equipos ganen sus juegos? 

i») ninguno de los equipos gane su juego? 

c) cuando menos uno de los equipos gane su juego? 

60 . Hay tres claves etiquetadas como “doble diario” en el programa de juegos Jeopardy. Si participan 
tres concursantes igualmente aptos, ¿cuál es la probabilidad de que: 

a) un solo concursante encuentre los tres “doble diario”? 
ib) el retador se lleve todos los “doble diario”? 

c) cada uno de los concursantes elija precisamente un “doble diario”? 

61 . Brooks Insurance, Inc., pretende ofrecer seguros de vida a hombres de 60 años por internet. Las 
tablas de mortalidad indican que la probabilidad de que un hombre de esa edad sobreviva otro 
año es de 0.98. Si el seguro se ofrece a cinco hombres de 60 años: 

a) ¿Cuál es la probabilidad de que los cinco hombres sobrevivan el año? 

Jb) ¿Cuál es la probabilidad de que por lo menos uno no sobreviva? 

62 . Cuarenta por ciento de las casas construidas en el área de Quail Creek incluyen un sistema de 
segundad. Se seleccionan 3 casas al azar. 

a) ¿Cuál es la probabilidad de que las tres casas seleccionadas cuenten con sistema de seguri- 
dad? 

ib) ¿De que ninguna de las tres casas seleccionadas cuente con sistema de seguridad? 

c) ¿De que por lo menos una de las casas seleccionadas cuente con sistema de seguridad? 

d) ¿Supone que los eventos son dependientes o independientes? 

63. Repase el ejercicio 62, pero suponga que hay 1 0 casas en el área de Quail Creek y cuatro de ellas 
cuentan con sistema de seguridad. Se eligen tres casas al azar. 

a) ¿Cuál es la probabilidad de que las tres casas seleccionadas cuenten con sistema de seguri- 
dad? 

Jb) ¿Cuál es la probabilidad de que ninguna de las tres casas seleccionadas cuente con sistema 
de seguridad? 
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c) ¿Cuál es la probabilidad de que por lo menos una de las tres casas seleccionadas cuente con 
sistema de seguridad? 

d) ¿Supone que los eventos son dependientes o independientes? 

64. Veinte familias viven en el Willbrook Farms Development. De ellas, 10 elaboraron sus propias 
declaraciones de impuestos del año pasado, 7 la encargaron a un profesional de la localidad y los 
restantes 3 las encargaron a H&R Block. 

a) ¿Cuál es la probabilidad de seleccionar a una familia que haya preparado su propia decla- 
ración? 

b) ¿Cuál es la probabilidad de seleccionar a dos familias que hayan preparado sus propias decla- 
raciones? 

c) ¿Cuál es la probabilidad de seleccionar a tres familias que hayan preparado sus propias decla- 
raciones? 

d) ¿Cuál es la probabilidad de seleccionar a dos familias, a ninguna de las cuales le elaboró sus 
declaraciones H&R Block? 

65 . La junta directiva de Saner Automatic Door Company consta de 12 miembros, 3 de los cuales son 
mujeres. Para redactar un nuevo manual relacionado con la política y procedimientos de la com- 
pañía, se elige al azar un comité de 3 miembros de la junta directiva para llevar a cabo la re- 
dacción. 

a) ¿Cuál es la probabilidad de que todos los miembros del comité sean hombres? 
ib) ¿Cuál es la probabilidad de que por lo menos un miembro del comité sea mujer? 

66. Una encuesta reciente publicada en BusinessWeek aborda el tema de los salarios de los directo- 
res ejecutivos de grandes compañías y si los accionistas ganan o pierden dinero. 



Director ejecutivo 
con un salario mayor 
que $1 000 000 

Director ejecutivo 
con un salario menor 
que $1 000 000 

Total 

Los accionistas ganan dinero 

2 

11 

13 

Los accionistas pierden dinero 

4 

3 

7 

Total 

6 

14 

20 


Si se selecciona al azar una compañía de la lista de 20 estudiadas, ¿cuál es la probabilidad de que: 

a) el director ejecutivo gane más de $1 000 000? 

ib) gane más de $1 000 000 o los accionistas pierdan dinero? 

c) gane más de $1 000 000 dado que los accionistas pierden dinero? 

d) se seleccionen 2 directores ejecutivos y se descubra que ambos ganan más de $1 000 000? 

67 . Althoff and Roll, una empresa de inversiones de Augusta, Georgia, se anuncia ampliamente en el 
Augusta Morning Gazette, el periódico que ofrece sus servicios en la región. El personal de mar- 
keting del Gazette calcula que 60% del mercado potencial de Althoff and Roll leyó el periódico; 
calcula, además, que 85% de quienes lo leyeron recuerdan la publicidad de Althoff and Roll. 

a) ¿Qué porcentaje del mercado potencial de la compañía inversionista ve y recuerda el anuncio? 

b) ¿Qué porcentaje del mercado potencial de la compañía inversionista ve, pero no recuerda el 
anuncio? 

68. Una compañía de internet localizada en Carolina del Sur tiene boletos de temporada para los jue- 
gos de basquetbol de Los Angeles Lakers. Su presidente siempre invita a uno de los cuatro vice- 
presidentes para que lo acompañe al juego, y afirma que selecciona a la persona al azar. Uno de 
los cuatro vicepresidentes no ha sido invitado para ir a alguno de los últimos cinco juegos en casa 
de los Lakers. ¿Cuál es la probabilidad de que ello pudiera deberse al azar? 

69 . Un proveedor minorista de computadoras compró un lote de 1 000 discos CD-R e Intentó forma- 
tearlos para una aplicación particular. Había 857 discos compactos en perfectas condiciones, 112 
se podían utilizar, aunque tenían sectores en malas condiciones y el resto no se podía emplear 
para nada. 

a) ¿Cuál es la probabilidad de que un CD seleccionado no se encuentre en perfecto estado? 

b) Si el disco no se encuentra en perfectas condiciones, ¿cuál es la probabilidad de que no se le 
pueda utilizar? 

70 . Un inversionista compró 100 acciones de Fifth Third Bank y 100 de Santee Electric Cooperative. 
La probabilidad de que las acciones del banco incrementen su valor en un año es de 0.70. La pro- 
babilidad de que las utilidades de la compañía eléctrica se incrementen en el mismo periodo es de 
0.60. 

a) ¿Cuál es la probabilidad de que las dos acciones aumenten de precio durante el periodo? 

b) ¿Cuál es la probabilidad de que las acciones del banco incrementen su precio, aunque las uti- 
lidades no lo hagan? 

c) ¿Cuál es la probabilidad de que por lo menos una de las acciones aumente de precio? 

71 . Flashner Marketing Research, Inc., se especializa en la evaluación de las posibles tiendas de ropa 
para dama en centros comerciales. Al Flashner, el presidente, informa que evalúa las posibles tien- 
das como buenas, regulares y malas. Los registros de anteriores evaluaciones muestran que 60% 
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de las veces los candidatos fueron evaluados como buenos; 30% de las veces regulares y 1 0% de 
las ocasiones, malos. De los que fueron calificados como buenos, 80% hicieron mejoras el primer 
año; los que fueron calificados como regulares, 60% hicieron mejoras el primer año y de los que 
fueron mal evaluados, 20% hicieron mejoras el primer año. Connie’s Apparel fue uno de los clien- 
tes de Flashner. Connie’s Apparel hizo mejoras el año pasado. ¿Cuál es la probabilidad de que se 
le haya dado originalmente una mala calificación? 

72 . Se recibieron de la fábrica dos cajas de camisas para caballero Oíd Navy. La caja 1 contenía 25 
camisas polo y 1 5 camisas Super-T. La caja 2 contenía 30 camisas polo y 1 0 camisas Super-T. Una 
de las cajas se seleccionó al azar y se eligió una camisa de dicha caja, también en forma aleato- 
ria, para revisarla. La camisa era polo. Dada esta información, ¿cuál es la probabilidad de que la 
camisa polo provenga de la caja 1 ? 

73 . En la compra de una pizza grande en Tony’s Pizza, el cliente recibe un cupón, que puede raspar 
para ver si tiene premio. Las posibilidades de ganar un refresco son de 1 en 10, y las posibilida- 
des de ganar una pizza grande son de 1 en 50. Usted tiene planes de almorzar mañana en Tony’s 
Pizza. ¿Cuál es la probabilidad de que usted: 

a) gane una pizza grande o un refresco? 

b) no gane nada? 

c) no gane nada en tres visitas consecutivas a Tony’s? 

d) gane por lo menos algo en sus siguientes tres visitas a Tony’s? 

74 . Para el juego diario de la lotería en Illinois, los participantes seleccionan tres números entre 0 y 9. 
No pueden seleccionar un número más de una vez, así que un billete ganador podría ser, por ejem- 
plo, 307, pero no 337. La compra de un billete le permite seleccionar un conjunto de números. Los 
números ganadores se anuncian en televisión todas las noches. 

a) ¿Cuántos diferentes resultados (números de tres dígitos) es posible formar? 

£>) Si compra un billete para el juego de la noche, ¿cuál es la probabilidad de que gane? 
c) Suponga que compra tres boletos para el juego de lotería de la noche y selecciona un número 
diferente para cada boleto. ¿Cuál es la probabilidad de que no gane con cualquiera de los bo- 
letos? 

75 . Hace varios años, Wendy’s Hamburgers anunció que hay 256 diferentes formas de pedir una ham- 
burguesa. Es posible elegir entre cualquiera de las siguientes combinaciones: mostaza, cátsup, 
cebolla, pepinillos, tomate, salsa, mayonesa y lechuga. ¿Es correcto el anuncio? Explique la forma 
en la que llegó a la respuesta. 

76 . Se descubrió que 60% de los turistas que fue a China visitaron la Ciudad Prohibida, el Templo del 
Cielo, la Gran Muralla y otros sitios históricos dentro o cerca de Beijing. Cuarenta por ciento de 
ellos visitó Xi’an, con sus magníficos soldados, caballos y carrozas de terracota, que yacen ente- 
rrados desde hace 2 000 años. Treinta por ciento de los turistas fueron tanto a Beijing como a 
Xi’an. ¿Cuál es la probabilidad de que un turista haya visitado por lo menos uno de estos lugares? 

77 . Considere una nueva goma de mascar que ayuda a quienes desean dejar de fumar. Si 60% de la 
gente que mastica la goma tiene éxito en dejar de fumar, ¿cuál es la probabilidad de que en un 
grupo de cuatro fumadores que mascan la goma por lo menos uno deje el cigarro? 

78 . Reynolds Construction Company está de acuerdo en no construir casas iguales en una nueva sub- 
división. Se ofrecen cinco diseños de exterior a los posibles compradores. La constructora ha uni- 
formado tres planos de interior que pueden incorporarse a cualquiera de los cinco modelos de 
exteriores. ¿Cuántos planos de exterior e interior se pueden ofrecer a los posibles compradores? 

79 . A un nuevo modelo de automóvil deportivo le fallan los frenos 15% del tiempo y 5% un mecanis- 
mo de dirección defectuoso. Suponga —y espere— que estos problemas se presenten de mane- 
ra independiente. Si ocurre uno u otro problema, el automóvil recibe el nombre de limón. Si ambos 
problemas se presentan, el automóvil se denomina riesgo. Su profesor compró uno de estos auto- 
móviles el día de ayer. ¿Cuál es la probabilidad de que sea: 

a) un limón? 

b) un riesgo? 

80 . En el estado de Maryland, las placas tienen tres números seguidos de tres letras. ¿Cuántas dife- 
rentes placas son posibles? 

81 . Hay cuatro candidatos para el cargo de director ejecutivo de Dalton Enterprises. Tres de los soli- 
citantes tiene más de 60 años de edad. Dos son mujeres, de las cuales sólo una rebasa los 60 
años. 

a) ¿Cuál es la probabilidad de que un candidato tenga más de 60 años y sea mujer? 

b) Si el candidato es hombre, ¿cuál es la probabilidad de que tenga menos de 60 años? 

c) Si el individuo tiene más de 60 años, ¿cuál es la probabilidad de que sea mujer? 

82 . Tim Beckie es propietario de Bleckie Investment y Real Estate Company. La compañía reciente- 
mente compró cuatro terrenos en Holly Farms Estates y seis terrenos en Newburg Woods. Los 
terrenos eran igual de atractivos y se venden en el mismo precio aproximadamente. 

a) ¿Cuál es la probabilidad de que los siguientes dos terrenos que se vendan se ubiquen en 
Newburg Woods? 

b) ¿Cuál es la probabilidad de que por lo menos uno de los siguientes cuatro que se vendan se 
ubique en Holly Farms? 

c) ¿Estos eventos son independientes o dependientes? 
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83. La contraseña de una computadora consta de cuatro caracteres. Los caracteres pueden ser una 
de las 26 letras del alfabeto. Cada carácter se puede incluir más de una vez. ¿Cuántas diferentes 
contraseñas puede haber? 

84. Una caja con 24 latas contiene 1 lata contaminada. Tres latas se van a elegir al azar para pro- 
barlas. 

a) ¿Cuántas diferentes combinaciones de 3 latas podrían seleccionarse? 

Jb) ¿Cuál es la probabilidad de que la lata contaminada se seleccione para la prueba? 

85. El acertijo de un periódico presenta un problema de comparación. Los nombres de los 10 presi- 
dentes de Estados Unidos aparecen en una columna, y los vicepresidentes se colocan en la 
segunda columna en lista aleatoria. En el acertijo se pide al lector que ponga en correspondencia 
a cada presidente con su vicepresidente. Si usted realiza las correspondencias al azar, ¿cuántas 
correspondencias son posibles? ¿Cuál es la probabilidad de que las 10 correspondencias sean 
correctas? 

86. Dos componentes, A y B, operan en serie. (Dos componentes A y B están en serie si ambos deben 
trabajar para que el sistema funcione.) Suponga que los dos componentes son independientes. 
¿Cuál es la probabilidad de que el sistema funcione en estas condiciones? La probabilidad de que 
A funcione es de 0.90, igual que la de B. 

87. Horwege Electronics, Inc., compra tubos de televisión a cuatro proveedores. Tyson Wholesale pro- 
porciona 20% de los tubos; Fuji Importers, 30%; Kirkpatricks 25%, y Parts, Inc., 25%. Tyson 
Wholesale normalmente tiene la mejor calidad, ya que sólo 3% de sus tubos llegan defectuosos. 
Cuatro por ciento de los tubos de Fuji Importers están defectuosos; 7% de los tubos de 
Kirkpatricks y 6.5% de los tubos de Parts, Inc., tienen defectos. 

a) ¿Cuál es el porcentaje total de tubos defectuosos? 

b) Un tubo de televisión defectuoso fue descubierto en el último envío. ¿Cuál es la probabilidad 
de que proviniera de Tyson Wholesale? 

88. ABC Auto Insurance clasifica a los conductores en buenos, de riesgo medio o malos. Los conduc- 
tores que solicitan un seguro caen dentro de estos tres grupos en porcentajes de 30, 50 y 20%, 
respectivamente. La probabilidad de que un buen conductor tenga un accidente es de 0.01 ; la pro- 
babilidad de un conductor de riesgo medio es de 0.03 y la probabilidad de que un mal conductor 
tenga un accidente es de 0.10. La compañía le vende al señor Brophy una póliza de seguro y él 
tiene un accidente. ¿Cuál es la probabilidad de que el señor Brophy sea: 

a) un buen conductor? 

b) un conductor de riesgo medio'? 

c) un mal conductor? 

89. Usted hace un viaje aéreo que involucra tomar tres vuelos independientes. Si existe 80% de pro- 
babilidades de que cada etapa específica del viaje se realice a tiempo, ¿cuál es la probabilidad de 
que los tres vuelos lleguen a tiempo? 

90. La probabilidad de que un servidor de red HP se caiga es de 0.05. Si usted tiene tres servidores 
independientes, ¿cuál es la probabilidad de que al menos uno de ellos sea funcional? 

91. Veintidós por ciento de todas las pantallas de cristal líquido (LCD) es fabricado por Samsung. 
¿Cuál es la probabilidad de que en un conjunto de tres compras independientes de LCD, cuando 
menos una sea Samsung? 

Ejercicios de lo base de datos 

92. Consulte los datos Real Estate, que contienen información sobre casas que se vendieron en el área 
de Goodyear, Arizona, durante el año pasado. 

a) Distribuya los datos en una tabla que muestre el número de casas con alberca frente al núme- 
ro de casas sin alberca en cada uno de los cinco municipios. Si selecciona una casa al azar, 
calcule las siguientes probabilidades: 

1. La casa se localiza en Township 1 o tiene alberca. 

2. Dado que la casa se encuentra en Township 3, que tenga alberca. 

3. Tiene alberca y se localiza en Township 3. 

b) Distribuya los datos en una tabla que muestre el número de casas con cochera frente a las que 
no la tienen en cada uno de los cinco municipios. Se elige una casa al azar y calcule las siguien- 
tes probabilidades. 

1. La casa tiene cochera. 

2. Si la casa se localiza en Township 5, que no tenga cochera. 

3. La casa tiene cochera y se localiza en Township 3. 

4. No tiene cochera o se localiza en Township 2. 

93. Consulte los datos Béisbol 2009, que contienen información sobre los 30 equipos de la Liga Mayor 
de Béisbol durante la temporada 2009. Establezca tres variables: 

Divida a los equipos en dos grupos, los que ganaron en la temporada y los que no lo hicieron. 
Es decir, cree una variable para contar los equipos que ganaron 81 juegos o más y los que 
ganaron 80 juegos o menos. 


Comandos de software 
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Cree una nueva variable para la asistencia, con tres categorías: una asistencia inferior a 2.0 
millones; una asistencia de 2.0 millones a 3.0 millones y una asistencia de 3.0 millones o más. 
Cree una variable que muestre los equipos que jugaron en un estadio de menos de 1 5 años de 
antigüedad, contra uno que tiene 15 años o más. 

Responda las siguientes cuestiones: 

a) Elabore una tabla que muestre el número de equipos que ganaron en la temporada frente a los 
que perdieron de acuerdo con las tres categorías de asistencia. Si selecciona un equipo al azar, 
calcule las siguientes probabilidades: 

1. Tener una temporada de victorias. 

2 . Tener una temporada de victorias o contar con una asistencia de más de 3.0 millones. 

3. Dada una asistencia de más de 3.0 millones, tener una temporada de victorias. 

4 . Tener una temporada de derrotas y contar con una asistencia de menos de 2.0 millones. 

b) Elabore una tabla que muestre el número de equipos que tuvieron una temporada de victorias 
contra los que jugaron en estadios antiguos o nuevos. Si selecciona un equipo al azar, calcule 
las siguientes probabilidades: 

1. Seleccionar un equipo con una temporada de victorias. 

2 . La probabilidad de seleccionar un equipo con un récord ganador que haya jugado en un 
estadio nuevo. 

3. El equipo tuvo un récord ganador o jugó en un estadio nuevo. 

94 . Consulte los datos de los camiones escolares que operan en el Distrito Escolar Buena. Establezca 
una variable que divida ia edad de ias autobuses en tres grupos: nuevos (menos de 5 años de 
edad), medios (5 años pero menores a 10 años) y viejos (10 o más años). El costo mediano 
de mantenimiento es de $456. Basándose en este valor, cree una variable para aquellos que están 
por debajo de la mediana (bajo mantenimiento) y los que están por encima de la mediana (alto 
mantenimiento). Finalmente, desarrolle una tabla que muestre la relación entre el costo de mante- 
nimiento y la edad del autobús. 

a) ¿Qué porcentaje de los autobuses es nuevo? 

b) ¿Qué porcentaje de los nuevos autobuses tiene un bajo mantenimiento? 

c) ¿Qué porcentaje de los viejos autobuses tiene alto mantenimiento? 

d) ¿El costo de mantenimiento parece estar relacionado con la edad dei autobús? Sugerencia: 
Compare el costo de mantenimiento de los viejos autobuses con el costo de los nuevos. 
¿Concluiría usted que el costo de mantenimiento es independiente de la edad? 


Comandos de software 


1. En seguida se enumeran los comandos de Excel para deter- a) Haga clic en la pestaña Formulas en la barra de herra- 

minar el número de permutaciones de la página 175. mientas y seleccione Inserí Function fx. 



b) En el cuadro Inserí Funcíion, seleccione Síaíisíical 
como categoría; vaya al recuadro PERMUT en la lista 
Selecí a function. Haga clic en OK. 

c) En el cuadro PERMUT, introduzca 8 en Number y en el 
cuadro de Number chosen, inserte 3. La respuesta 
correcta, 336, aparece dos veces en el cuadro. 
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2. Los comandos de Excel para determinar el número de com- a) Haga clic en Formulas en la barra de herramientas y 

binaciones de la página 175 son los siguientes. seleccione Insert Function fx. 



b) En el cuadro Insert function, seleccione Math & Trig 
como categoría y vaya a COMBIN en la lista Select a 
function. Haga clic en OK. 

c) En el cuadro COMBIN, escriba 7 en Number y 3 en 
Number chosen. La respuesta correcta, 35, aparece 
dos veces en el cuadro. 



Capítulo 5 


Respuestas a las autoevaluaciones 



5-1 a) Cuente el número que piensa que el nuevo juego es 
operable. 

b) A 73 jugadores les gustó el juego. Hay muchas otras 
respuestas posibles. 

c) No. La probabilidad no puede ser mayor que 1 . La 
probabilidad de que el juego sea un éxito si se comer- 
cializa es de 65/80, o 0.8125. 

d) No puede ser menor que 0. Tal vez un error aritmético. 

e) A más de la mitad de los jugadores que probaron el 
juego, les gustó. (Por supuesto, hay otras posibles 
respuestas.) 


5-2 1. 


4 reinas en una baraja 4 - 

— = - = 0.0769. Clasico. 


52 cartas en total 


52 


2. — = 0.338. Empírico. 

539 

3. El punto de vista del autor al escribir el libro es que la 
probabilidad de que el DJIA aumente a 12 000 es de 
0.25. Usted podría ser más o menos optimista. 
Subjetivo. 


5-3 a) i) 


(50 + 68) 
2 000 


.059 


ii) 


302 
2 000 


.849 
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5-4 


c) No son complementarios, pero son mutuamente b) Probabilidades conjuntas 



5-5 (,95)(.95)(.95)(.95) = .8145 

5-6 a) 0.002, que se determina por: 



b) 0.14, que se determina por: 


5-9 a) P{A 3 \B 2 ) = 

b) 


P(A 3 )P(B 2 \A 3 ) 

P(A,)P(B 2 \A,) + P(A 2 )P[B 2 \A 2 ) + P(A 3 )P(B 2 \A 3 ) 
(.50)(.96) 

(,30)(.97) + (,20)(.95) + (,50)(.96) 

.480 


.961 


= .499 



1 680 
11 880 


= .1414 


5-7 


c) No, porque existen otras posibilidades, como tres 
mujeres y un hombre. 


a) P(e 4 ) 


105 

200 


.525 


5-10 1. (5)(4) = 20 

2. (3)(2)(4)(3) = 72 

5-11 1. a) 60, que se calcula multiplicando (5)(4)(3). 
b) 60, que se calcula: 

5! 5-4-3-2--T 

(5 - 3)! “ 2^t 


b ) P(A 2 \B 4 ) 


30 

105 


.286 


c) P(A 2 o e 4 ) 


80 105 _ 30^ _ 155 

200 + 200 _ 200 ” 200 


.775 


5-8 a) La independencia requiere que P{A\B) = P(A). Una 
posibilidad es: 


P(visitas frecuentes|sí, ubicación conveniente) = 
P(visitas frecuentes) 


¿60/90 = 80/195? No, las dos variables no son inde- 
pendientes. 

Por consiguiente, cualquier probabilidad conjunta en 
la tabla debe calcularse aplicando la regla general 
de la multiplicación. 


2. 5 040 que se calcula: 

10! _ 10-9-8-7-&i5-4-8^T 

(10- 4)! ~ 6^5-4-&-2^T 

3. a) 56 es correcto, el cual se calcula: 

„ 8! 

Q — — — 50 

8 3 r!(n - r)l 31(8 - 3)1 
b) Sí. Hay 45 combinaciones, que se calculan: 

^ n! 101 

C. = = = 45 

10 2 r\(n - r ) ! 21(10-2)1 


4. a) 


p 

50 3 


50! 

(50 - 3)! 


1 1 7 600 


. . ^ 50! 

b) C = 

50 3 3! (50 3)1 


= 1 9 600 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Distribuciones de 
probabilidad discreta 


OA1 Explicar las 
características de una 
distribución de probabilidad. 

OA2 Distinguir entre una 
variable aleatoria discreta y 
una continua. 

OA3 Calcular la media de 
una distribución de 
probabilidad. 

OA4 Calcular la varíanza y la 
desviación estándar de una 
distribución de probabilidad. 

OA5 Describir y calcular las 
probabilidades de una 
distribución blnomlal. 

OA6 Describir y calcular las 
probabilidades de una 
distribución hlpergeométrlca. 

OA7 Describir y calcular las 
probabilidades de una 
distribución de Poisson. 



Estadísticas recientes sugieren que 15% de los que visitan un sitio de 
ventas de menudeo en la web realiza la compra. Un minorista desea 
verificar esta afirmación. Para hacerlo, seleccionó una muestra de 16 
“visitas” de su sitio y descubrió que en realidad 4 realizaron una compra. 
¿Cuál es la probabilidad de que exactamente cuatro realicen una compra? 
¿Cuántas compras deben esperarse? ¿Cuál es la probabilidad de que 
cuatro o más “visitas” terminen en compra? (Vea el ejercicio 49, objetivo 5.) 


6.2 ¿Qué es una distribución de probabilidad? 
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6.1 Introducción 

Los capítulos 2 a 4 se dedicaron al estudio de la estadística descriptiva: datos en bruto orga- 
nizados en una distribución de frecuencias, la cual se representa en tablas, gráficas y diagra- 
mas. Asimismo, se calculó una medida de ubicación —como la media aritmética, la mediana 
o la moda— para localizar un valor típico cercano al centro de la distribución. Mediante el 
rango y la desviación estándar se describió la dispersión de los datos. Estos capítulos se cen- 
tran en describir algo que sucedió. 

A partir del capítulo 5, el tema cambia: ahora el análisis es sobre algo que posiblemente 
suceda. Esta faceta de la estadística recibe el nombre de estadística inferencial. El objetivo 
consiste en hacer inferencias (afirmaciones) sobre una población con base en determinada 
cantidad de observaciones, denominadas muestras, que se seleccionan de la población. En el 
capítulo 5 se estableció que una probabilidad es un valor entre 0 y 1, inclusive, y se analizó la 
forma en que las probabilidades pueden combinarse de acuerdo con las reglas de la adición 
y la multiplicación. 

En este capítulo comienza el estudio de las distribuciones de probabilidad. Una distri- 
bución de probabilidad proporciona toda la gama de valores que se pueden presentar en un 
experimento. Es similar a una distribución de frecuencias relativas, pero, en lugar de describir 
el pasado, describe la probabilidad de que un evento se presente en el futuro. Por ejemplo, si 
un fabricante de medicamentos afirma que cierto tratamiento permitirá que 80% de la pobla- 
ción baje de peso, la agencia de protección al consumidor quizá someta a prueba el tratamien- 
to con una muestra de seis personas. Si la afirmación del fabricante es cierta, es casi imposi- 
ble tener un resultado en el que nadie en la muestra pierda peso y es muy probable que 5 de 
cada 6 pierdan peso. 

En este capítulo se examinan la media, la varianza y la desviación estándar de una distri- 
bución de probabilidad, así como tres distribuciones de probabilidad que se presentan con fre- 
cuencia: binomial, hipergeométrica y de Poisson. 

6.2 ;Qué es una distribución de probabilidad? 

Una distribución de probabilidad muestra los posibles resultados de un experimento y la pro- 
babilidad de que cada uno se presente. 


OA1 Explicar las 
características de una 
distribución de probabilidad. 


DISTRIBUCIÓN DE PROBABILIDAD Lista de todos los resultados de un experimento y la probabi- 
lidad asociada a cada uno de ellos. 


A continuación se mencionan las principales características de una distribución de probabilidad. 


í • " 

CARACTERISTICAS DE UNA DISTRIBUCION DE PROBABILIDAD 

1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive. 

2. Los resultados son eventos mutuamente excluyentes. 

3. La lista es exhaustiva. Por lo tanto, la suma de las probabilidades de los diversos even- 
tos es igual a 1. 


¿Cómo generar una distribución de probabilidad? El siguiente ejemplo sirve para ilustrarlo. 



Suponga que le interesa el número de caras que aparecen en tres lanzamientos de una mone- 
da. Tal es el experimento. Los posibles resultados son: cero caras, una cara, dos caras y tres 
caras. ¿Cuál es la distribución de probabilidad del número de caras? 

Hay ocho posibles resultados. En el primer lanzamiento puede aparecer una cara, una cruz en 
el segundo y otra cruz en el tercero. O puede obtener cruz, cruz y cara, en ese orden. Para 
obtener el conteo de resultados (5-8), aplique la fórmula de la multiplicación: (2)(2)(2), es decir, 
8 posibles resultados. Estos resultados se listan en seguida. 
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Resultado 

Lanzamiento de la moneda 

Número 

posible 

Primero 

Segundo 

Tercero 

de caras 

1 

T 

T 

T 

0 

2 

T 

I 

H 

1 

3 

T 

H 

T 

1 

4 

T 

H 

H 

2 

5 

H 

T 

T 

1 

6 

H 

T 

H 

2 

7 

H 

H 

T 

2 

8 

H 

H 

H 

3 


Observe que el resultado cero caras ocurre sólo una vez; una cara ocurre tres veces; dos 
caras, tres veces, y el resultado tres caras ocurre una sola vez. Es decir, cero caras se presen- 
tó una de ocho veces. Por consiguiente, la probabilidad de cero caras es de un octavo; la pro- 
babilidad de una cara es de tres octavos, etc. La distribución de probabilidad se muestra en la 
tabla 6-1 . Como uno de estos resultados debe suceder, el total de probabilidades de todos los 
eventos posibles es 1.000. Esto siempre se cumple. La gráfica 6-1 contiene la misma infor- 
mación. 


TABLA 6-1 Distribución de probabilidad de los eventos relativos a cero, una, dos y tres caras en tres 
lanzamientos de una moneda 


Número 

Probabilidad 

de caras, 

del resultado, 

X 

P(x ) 

0 

LO 

C\J 

II 

i- I co 

i 

r 375 

2 

r 375 

3 

8= ^ 

Total 

1 ' ,0 “ 


P(x) 


o 

ni 


3 

8 

1 

8 

1 

8 


0 

0 12 3 


Número de caras 


GRÁFICA 6-1 




Presentación gráfica del número de caras que resultan de tres lanzamientos 
de una moneda y la probabilidad correspondiente 


6.3 Variables aleatorias 
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Autoevaluación 6-1 



Refiérase al ejemplo del lanzamiento de una moneda de la tabla 6-1 . La probabilidad de x 
se representa P(x). De esta manera, la probabilidad de cero caras es P( 0 caras) = 0.125, y la 
probabilidad de una cara es P( 1 cara) = 0.375, etc. La suma de estas probabilidades mutua- 
mente excluyentes es 1; es decir, de acuerdo con la tabla 6-1, 0.125 + 0.375 + 0.375 + 0.125 
= 1 . 00 . 


Los posibles resultados de un experimento que implica el lanzamiento de un dado son: uno, dos, 
tres, cuatro, cinco y seis. 

a) Elabore la distribución de probabilidad para el número de posibles resultados. 

b) Represente gráficamente la distribución de probabilidad. 

c) ¿Cuál es la suma de las probabilidades? 


6,3 Variables aleatorias 

En cualquier experimento aleatorio, los resultados se presentan al azar; así, a éste se le deno- 
mina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento: puede ocurrir 
cualquiera de los seis posibles resultados. Algunos experimentos dan origen a resultados de 
índole cuantitativa (como dólares, peso o número de niños); otros generan resultados de natu- 
raleza cualitativa (como el color o la afiliación religiosa). Cada valor de la variable aleatoria se 
relaciona con una probabilidad que indica la posibilidad de un resultado determinado. Unos 
cuantos ejemplos aclararán el concepto de variable aleatoria. 

• Si cuenta el número de empleados ausentes en el turno matutino del lunes, el número 
puede ser 0, 1, 2, 3,... El número de ausencias es una variable aleatoria. 

• Si pesa cuatro lingotes de acero, los pesos pueden ser de 2 492 libras, 2 497 libras, 2 506 
libras, etc. El peso es una variable aleatoria. 

• Si lanza dos monedas y cuenta el número de caras, puede caer cero, una o dos caras. 
Como el número de caras que resulta de este experimento se debe al azar, el número de 
caras que caen es una variable aleatoria. 

• Otras variables aleatorias pueden ser el número de focos defectuosos producidos por 
hora en Cleveland Company, Inc.; la calidad (9, 10, 11 o 12) de los miembros del equipo 
de basquetbol femenil de St. James; el número de corredores del maratón de Boston en 
la carrera de 2010 y la cantidad diaria de conductores multados por conducir bajo la 
influencia del alcohol en Texas. 


VARIABLE ALEATORIA Cantidad que resulta de un experimento que, por azar, puede adoptar 
diferentes valores. ^ 


El siguiente diagrama ilustra los términos experimento, resultado, evento y variable alea- 
toria. Primero, en el caso del experimento en el que se lanza una moneda tres veces, hay ocho 
posibles resultados. En este experimento, interesa el evento de que se presenta una cara en 
tres lanzamientos. La variable aleatoria es el número de caras. En términos de probabilidad, 
desea saber la probabilidad del evento que tiene una variable aleatoria igual a 1. El resultado 
es P(1 cara en 3 lanzamientos) = 0.375. 

Posibles resultados de tres lanzamientos de moneda 



Ocurre el evento (una cara), y la variable aleatoria x = 1 . 


Una variable aleatoria puede ser discreta o continua. 



190 


CAPÍTULO 6 Distribuciones de probabilidad discreta 


OA2 Distinguir entre una 
variable aleatoria discreta y 
una continua. 


Variable aleatoria discreta 

Una variable aleatoria discreta adopta sólo cierto número de valores separados. Si hay 100 
empleados, el recuento de la cantidad de ausentes el lunes sólo puede ser 0, 1, 2, 3, 100. 

Una variable discreta suele ser resultado de contar algo. Por definición: 


VARIABLE ALEATORIA DISCRETA Variable aleatoria que adopta sólo valores claramente separa- 
dos. 


A veces, una variable aleatoria discreta asume valores fraccionarios o decimales. Estos 
valores deben estar separados: debe haber cierta distancia entre ellos. Por ejemplo, las califi- 
caciones de los jueces por destreza técnica y formas artísticas en una competencia de pati- 
naje artístico son valores decimales, como 7.2, 8.9 y 9.7. Dichos valores son discretos, pues 
hay una distancia entre calificaciones de 8.3 y 8.4. Una calificación no puede tener un valor de 
8.34 o de 8.347, por ejemplo. 


Variable aleatoria continua 

Por otra parte, si la variable aleatoria es continua, es una distribución de probabilidad conti- 
nua. Si mide algo, como la anchura de una recámara, la estatura de una persona o la presión 
de la llanta de un automóvil, se trata de una variable aleatoria continua. Se puede suponer una 
infinidad de valores, con ciertas limitaciones. Por ejemplo: 

• Los tiempos de los vuelos comerciales entre Atlanta y Los Ángeles son de 4.67 horas, 5.13 
horas, etc. La variable aleatoria es la cantidad de horas. 

• La presión, medida en libras por pulgada cuadrada (psi), de un nuevo neumático Chevy 
Trail-blazer puede ser de 32.78 psi, 31.62 psi, 33.07 psi, etc. En otras palabras, es razo- 
nable que se presente cualquier valor entre 28 y 35. La variable aleatoria es la presión de 
la llanta. 

Por lógica, si organiza un conjunto de posibles valores de una variable aleatoria en una 
distribución de probabilidad, el resultado es una distribución de probabilidad. Así, ¿cuál es 
la diferencia entre una distribución de probabilidad y una variable aleatoria? Una variable alea- 
toria representa el resultado particular de un experimento. Una distribución de probabilidad 
representa todos los posibles resultados, así como la correspondiente probabilidad. 

Las herramientas que se utilizan, así como las interpretaciones probabilísticas, son dife- 
rentes en el caso de distribuciones de probabilidades discretas y continuas. Este capítulo se 
limita al análisis e interpretación de distribuciones discretas. En el siguiente capítulo se estu- 
diarán las distribuciones continuas. ¿Cuál diría que es la diferencia entre los dos tipos de dis- 
tribuciones? Por lo general, una distribución discreta es el resultado de contar algo, como: 

• El número de caras que se presentan en tres lanzamientos de una moneda. 

• El número de estudiantes que obtienen A en clase. 

• El número de empleados de producción que se ausentaron hoy en el segundo turno. 

• El número de comerciales de 30 segundos que pasan en la NBC de las 8 a las 11 de la 
noche. 

Las distribuciones continuas son el resultado de algún tipo de medición, como: 

• La duración de cada canción en el último álbum de Linkin Park. 

• El peso de cada estudiante de esta clase. 
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• La temperatura ambiente en el momento en que usted lee este libro. 

• La suma de dinero que gana cada uno de los 750 jugadores actuales en la lista de los 
equipos de la Liga Mayor de Béisbol. 


6.4 Media, varianza y desviación estándar 
de una distribución de probabilidad discreta 

En el capítulo 3 estudió medidas de ubicación y variación de una distribución de frecuencias. 
La media indica la posición central de los datos, y la varianza describe la dispersión de los 
datos. De forma similar, una distribución de probabilidad queda resumida por su media y su 
varianza. La media de una distribución de frecuencias se identifica mediante la letra minúscu- 
la griega mu (p,), y la desviación estándar, con sigma (ct). 


Media 

La media constituye un valor típico para representar la posición central de una distribución de 
probabilidad. También es el valor promedio a la larga de la variable aleatoria. La media de una 
distribución de probabilidad también recibe el nombre de valor esperado. Se trata de un pro- 
medio ponderado en el que los posibles valores de una variable aleatoria se ponderan con sus 
correspondientes probabilidades de ocurrir. 

La media de una distribución de probabilidad discreta se calcula con la fórmula: 


OA3 Calcular la media de 
una distribución de 
probabilidad. 

aquí P(x) es la probabilidad de un valor particular x. En otras palabras, se multiplica cada valor 
x por la probabilidad de que ocurra y en seguida se suman los productos. 

Varianza y desviación estándar 

Como se observó, la media constituye un valor típico para resumir una distribución de proba- 
bilidad discreta. Sin embargo, no describe el grado de dispersión (variación) en una distribu- 
ción. La varianza sí lo hace. La fórmula de la varianza de una distribución de probabilidad es: 


OA4 Calcular la varianza y 
la desviación estándar de una 
distribución de probabilidad. 


0 


l 2 ' 


VARIANZA DE UNA DISTRIBUCION DE PROBABILIDAD 


a 2 = S[(K - p r) 2 P(x)] 


(6 


0 


MEDIA DE UNA DISTRIBUCION DE PROBABILIDAD 


ix = 2[xP(x)j 


(6-1) 


) 


Los pasos para el cálculo son los siguientes: 


1 . La media se resta de cada valor y la diferencia se eleva al cuadrado. 

2. Cada diferencia al cuadrado se multiplica por su probabilidad. 

3. Se suman los productos que resultan para obtener la varianza. 


La desviación estándar, cr, se determina al extraer la raíz cuadrada positiva de cr 2 ; es decir, 

2 


cr = V ct 

Un ejemplo ayudará a explicar los detalles del cálculo e interpretación de la media y la 
desviación estándar de una distribución de probabilidad. 
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Cjemplo 


Solución 



John Ragsdale vende automóviles nuevos en Pelican 
Ford. Por lo general, John vende la mayor cantidad de 
automóviles el sábado. Desarrolló la siguiente distribu- 
ción de probabilidades de la cantidad de automóviles 
que espera vender un sábado determinado. 


Cantidad de 
automóviles 
vendidos, x 

Probabilidad, 

pía 

0 

.10 

1 

.20 

2 

.30 

3 

.30 

4 

.10 

Total 

1.00 


1 . 

2 . 

3. 


¿De qué tipo de distribución se trata? 

¿Cuántos automóviles espera vender John un sá- 
bado normal? 

¿Cuál es la varianza de la distribución? 


1. Se trata de una distribución de probabilidad discreta de la variable aleatoria denominada 
número de automóviles vendidos. Observe que John sólo espera vender cierto rango de 
automóviles; no espera vender 5 automóviles ni 50. Además, no puede vender medio 
vehículo. Sólo puede vender 0, 1, 2, 3 o 4 automóviles. Asimismo, los resultados son 
mutuamente excluyentes: no puede vender un total de 3 y 4 automóviles el mismo 
sábado. 

2. La media de la cantidad de automóviles vendidos se calcula al multiplicar el número de 
automóviles que vendió por la probabilidad de vender dicho número, y sumar los pro- 
ductos de acuerdo con la fórmula (6-1): 

M- = 2[xP(x)] 

= 0(.10) + 1 (.20) + 2(.30) + 3(.30) + 4(.10) 

= 2.1 

Estos cálculos se resumen en la siguiente tabla. 


Número de 

automóviles 

vendidos, 

X 

Probabilidad, 

P(x) 

x ■ P(x) 

0 

.10 

0.00 

1 

.20 

0.20 

2 

.30 

0.60 

3 

.30 

0.90 

4 

.10 

0.40 

Total 

1.00 

¡ju = 2.10 


¿Cómo interpretar una media de 2.1? Este valor indica que, a lo largo de una gran can- 
tidad de sábados, John Ragsdale espera vender un promedio de 2.1 automóviles por día. 
Por supuesto, no es posible vender exactamente 2.1 automóviles un sábado en particu- 
lar. Sin embargo, el valor esperado se utiliza para predecir la media aritmética de la can- 
tidad de automóviles vendidos a largo plazo. Por ejemplo, si John trabaja 50 sábados en 
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un año, puede esperar vender (50)(2.1) o 105 automóviles sólo los sábados. Por consi- 
guiente, a veces la media recibe el nombre de valor esperado. 

3. De nuevo, una tabla resulta útil para sistematizar los cálculos de la varianza, que es de 
1.290. 


Número de 
automóviles 
vendidos, 

X 

Probabilidad, 

P(x) 

(x- 

P-) 

( X ~ M -) 2 

(X - ») 2 P(x) 

0 

.10 

0 - 

2.1 

4.41 

0.441 

1 

.20 

1 - 

2.1 

1.21 

0.242 

2 

.30 

2 - 

2.1 

0.01 

0.003 

3 

.30 

3 - 

2.1 

0.81 

0.243 

4 

.10 

4 - 

2.1 

3.61 

0.361 






< r 2 = 1 .290 


Recuerde que la desviación estándar, a, es la raíz cuadrada positiva de la varianza. En este 
ejemplo es Va 3 = Vi .290 = 1 .136 automóviles. ¿Cómo interpretar una desviación estándar 
de 1.136 automóviles? Si la vendedora Rita Kirsch también vendió un promedio de 2.1 auto- 
móviles los sábados y la desviación estándar de sus ventas fue de 1 .91 automóviles, conclui- 
ría que hay más variabilidad en las ventas sabatinas de Kirsch que en las de Ragsdale (pues 
1.91 > 1.136). 



Pizza Palace ofrece tres tamaños de refresco de cola —chico, mediano y grande— para acompañar 
su pizza. Los refrescos cuestan $0.80, $0.90 y $1 .20, respectivamente. Treinta por ciento de los 
pedidos corresponde al tamaño chico; 50%, al mediano, y 20%, al grande. Organice el tamaño de 
los refrescos y la probabilidad de venta en una distribución de probabilidad. 

a) ¿Se trata de una distribución de probabilidad discreta? Indique por qué. 

b ) Calcule la suma promedio que se cobra por refresco de cola. 

c) ¿Cuál es la varianza de la cantidad que se cobra por un refresco de cola? ¿Cuál es la desviación 
estándar? 


comed: 


Ejercicios 

1. Calcule la media y la varianza de la siguiente distribución de probabilidad discreta. 


X 

P(x) 

0 

.2 

i 

.4 

2 

.3 

3 

.1 


2. Calcule la media y la varianza de la siguiente distribución de probabilidad discreta. m 


X 

P(x) 

2 

.5 

8 

.3 

10 

.2 
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3. Calcule la media y la varianza de la siguiente distribución de probabilidad. 


X 

P(x) 

5 

.1 

10 

.3 

15 

.2 

20 

.4 


4 . ¿Cuáles de las siguientes variables aleatorias son discretas y cuáles continuas? 

a) El número de cuentas nuevas conseguidas por un vendedor en un año. 

b) El tiempo que transcurre entre la llegada de cada cliente en un cajero automático. 

c) El número de clientes en la estética Big Nick. 

d ) La cantidad de combustible que contiene el tanque de gasolina de su automóvil. 

e) La cantidad de miembros del jurado pertenecientes a una minoría. 

f) La temperatura ambiente el día de hoy. 

5 . La información que sigue representa el número de llamadas diarias al servicio de emergencia por 
el servicio voluntario de ambulancias de Walterboro, Carolina del Sur, durante los últimos 50 días. 
En otras palabras, hubo 22 días en los que se realizaron 2 llamadas de emergencia, y 9 días en los 
que se realizaron 3 llamadas de emergencia. 


Número de llamadas 

Frecuencia 

0 

8 

1 

10 

2 

22 

3 

9 

4 

1 

Total 

50 


a) Convierta esta información sobre el número de llamadas en una distribución de probabilidad. 

b) ¿Es un ejemplo de distribución de probabilidad discreta o continua? 

c) ¿Cuál es la media de la cantidad de llamadas de emergencia al día? 

d) ¿Cuál es la desviación estándar de la cantidad de llamadas diarias? 

6. El director de admisiones de Kinzua University en Nueva Escocia estimó la distribución de admi- 
siones de estudiantes para el segundo semestre con base en la experiencia de años pasados. 
¿Cuál es el número de admisiones esperado para el segundo semestre? Calcule la varianza y la 
desviación estándar del número de admisiones. Sfri 


Admisiones 

Probabilidad 

1 000 

.6 

1 200 

.3 

1 500 

.1 


7 . Belk Department Store tiene una venta especial este fin de semana. Los clientes que registren car- 
gos por compras de más de $50 en su tarjeta de crédito de Belk recibirán una tarjeta especial de 
la lotería de la empresa. El cliente raspará la tarjeta, la cual indica la cantidad que se descontará 
del total de compras. A continuación aparecen la suma del premio y el porcentaje de tiempo que 
se deducirá del total de las compras. 


Suma de premios 

Probabilidad 

$ 10 

.50 

25 

.40 

50 

.08 

100 

.02 


a) ¿Cuál es la cantidad media deducida de la compra total? 

b) ¿Cuál es la desviación estándar de la cantidad deducida del total de las compras? 
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8. La Downtown Parking Authority, de Tampa, Florida, reportó los siguientes datos de una muestra 
de 250 clientes relacionados con el número de horas que se estacionan los automóviles y las can- 
tidades que pagan. 


Número de horas 

Frecuencia 

Pago 

1 

20 

$ 3.00 

2 

38 

6.00 

3 

53 

9.00 

4 

45 

12.00 

5 

40 

14.00 

6 

13 

16.00 

7 

5 

18.00 

8 

36 

20.00 


250 



a) Convierta la información del número de horas de estacionamiento en una distribución de pro- 
babilidad. ¿Es una distribución de probabilidad discreta o continua? 

b) Determine la media y la desviación estándar del número de horas de estacionamiento. ¿Qué 
respondería si se le pregunta por el número de horas que se estaciona un cliente normal? 

c) Calcule la media y la desviación estándar del pago. 


6.5 Distribución de probabilidad binomial 


OA5 Describir y calcular las 
probabilidades de una 
distribución binomial. 


La distribución de probabilidad binomial es una distribución de probabilidad discreta que se 
presenta con mucha frecuencia. Una de sus características consiste en que sólo hay dos posi- 
bles resultados en un determinado ensayo del ex- 
perimento. Por ejemplo, el enunciado en una pre- 
gunta de cierto o falso puede ser o cierto o falso. 
Los resultados son mutuamente excluyentes, lo 
cual significa que la respuesta a una pregunta de 
cierto o falso no puede ser al mismo tiempo cierta 
o falsa. En otro ejemplo, un producto se clasifica 
como aceptable o inaceptable por el departamen- 
to de control de calidad; un trabajador se clasifi- 
ca como empleado o desempleado, y una llamada 
da como resultado que el cliente compre el pro- 
ducto o no lo compre. Con frecuencia, se clasifican los dos posibles resultados como éxito y 
fracaso. Sin embargo, esta clasificación no implica que un resultado sea bueno y el otro malo. 

Otra característica de la distribución binomial es el hecho de que la variable aleatoria es 
el resultado de conteos. Es decir, se cuenta el número de éxitos en el número total de ensa- 
yos. Lance una moneda equilibrada cinco veces y cuente el número de veces que aparece una 
cara; seleccione 10 trabajadores y liste cuántos tienen más de 50 años, o seleccione 20 cajas 
de Raisin Bran de Kellog y cuente el número de cajas que pesan más de lo que indica el 
paquete. 

Una tercera característica de una distribución binomial consiste en que la probabilidad de 
éxito es la misma de un ensayo a otro. Dos ejemplos son: 



• La probabilidad de que adivine la primera pregunta de una prueba de verdadero o falso 
(éxito) es de un medio. Esto constituye el primer ensayo. La probabilidad de que adivine 
la segunda pregunta (segundo ensayo) también es de un medio; la probabilidad de éxito 
en el tercer ensayo es un medio y así sucesivamente. 

• Si la experiencia reveló que el puente giratorio sobre Intercoastal Waterway, en Socastee, 
se elevó una de cada 20 veces que usted se aproximó a él, entonces la probabilidad es 
un veinteavo (un éxito) de que se eleve la próxima ocasión que se acerque a él, es de un 
veinteavo la siguiente vez y así consecutivamente. 
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La última característica de una distribución de probabilidad binomial consiste en que cada 
ensayo es independiente de cualquier otro. Que sean independientes significa que no existen 
patrones en los ensayos. El resultado de un ensayo particular no influye en el resultado de otro 
ensayo. Dos ejemplos de lo anterior son: 

• Una joven familia tiene dos niños, ambos varones. La probabilidad de que el tercer hijo 
sea un varón sigue siendo 0.50. Es decir, el género del tercer hijo es independiente de los 
otros dos. 

• Suponga que 20% de los pacientes atendidos en la sala de urgencias del Waccamaw 
Hospital no tiene seguro médico. Si el segundo paciente atendido en el turno vespertino 
hoy no tiene seguro, eso no afecta la probabilidad de que el tercero, el décimo o cualquie- 
ra de los otros pacientes cuente o no con seguro. 


EXPERIMENTO DE PROBABILIDAD BINOMIAL 

1 . El resultado de cada ensayo de un experimento se clasifica en una de dos categorías 
mutuamente excluyentes: éxito o fracaso. 

2. La variable aleatoria permite contar el número de éxitos en una cantidad fija de en- 
sayos. 

3. La probabilidad de éxito y fracaso es la misma en cada ensayo. 

4. Los ensayos son independientes, lo cual significa que el resultado de un ensayo no 
influye en el resultado del otro. 

V y 


¿Cómo se calcula una probabilidad binomial? 

Para construir una probabilidad binomial particular se necesita: 1) el número de ensayos y 2) 
la probabilidad de éxito de cada ensayo. Por ejemplo, si un examen al término de un semina- 
rio de administración incluye 20 preguntas de opción múltiple, el número de ensayos es 20. Si 
cada pregunta contiene cinco opciones y sólo una de ellas es correcta, la probabilidad de éxito 
en cada ensayo es 0.20. Por consiguiente, la probabilidad de que una persona sin conocimien- 
tos del tema acierte la respuesta a una pregunta es de 0.20. De modo que se cumplen las con- 
diciones de la distribución binomial recién indicadas. 

Una probabilidad binomial se calcula mediante la fórmula: 



^FÓRMULA DE LA PROBABILIDAD BINOMIAL P(x) = n C x ir*(1 - -tt)" x (6-3) ^ 


donde: 

C es el símbolo de combinación. 
n es el número de ensayos. 

x es la variable aleatoria definida como el número de éxitos. 
tt es la probabilidad de éxito en cada ensayo. 

Empleamos la letra griega -tt (pi) para representar un parámetro de población binomial. No con- 
fundir con la constante matemática 3.1416. 

r 

Cjemplo 

US Airways tiene cinco vuelos diarios de Pittsburgh al Aeropuerto Regional de Bradford, 
Pennsylvania. Suponga que la probabilidad de que cualquier vuelo llegue tarde sea de 0.20. 
¿Cuál es la probabilidad de que ninguno de los vuelos llegue tarde hoy? ¿Cuál es la probabili- 
dad de que exactamente uno de los vuelos llegue tarde hoy? 

Solución 

Aplique la fórmula (6-3). La probabilidad de que un vuelo llegue tarde es de 0.20, así, tt = 0.20. 
Hay cinco vuelos, por lo que n = 5, y x, la variable aleatoria, se refiere al número de éxitos. En 
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este caso un éxito consiste en que un avión llegue tarde. Como no hay demoras en las llega- 
das, x = 0. 

P(0) = n C»*(1 - TT) n -* 

= 5 C 0 (. 20)°(1 - ,20) 5 “ 0 = (1)(1)(.3277) = .3277 

La probabilidad de que exactamente uno de los cinco vuelos llegue tarde hoy es de 0.4096, 
que se calcula de la siguiente manera: 

P(i) = n CM)V ~ ■*)"-* 

= 5 C-|(. 20^(1 - .20) 5 - 1 = (5)(.20)(.4096) = .4096 

La distribución de probabilidad binomial completa con tt = 0.20 y n = 5 aparece en la si- 
guiente gráfica de barras. Observe que la probabilidad de que exactamente 3 vuelos lleguen 
tarde es de 0.0512, y, del diagrama de barras, que la distribución del número de llegadas 
demoradas tiene un sesgo positivo. 


Distribución de probabilidad del número de vuelos retrasados 


OJJOO 


1 9 2500 


o 5:>x> 


01900 


00)00 


00000 






0M12 


Número de vuelos retrasados 


000*4 


9 000 ) 


La media (p.) y la varianza (o 2 ) de una distribución binomial se calculan con la siguiente fór- 
mula, fácil y rápida: 




MEDIA DE UNA DISTRIBUCION BINOMIAL 


p, = ñu 


(6-4) 




VARIANZA DE UNA DISTRIBUCION BINOMIAL 


cr 2 = mr(1 — -tt) 


(6-5) 




Por ejemplo, respecto del número de vuelos retrasados, recuerde que tt = 0.20 y n = 5. 
Por lo tanto: 


p. = mr = (5)(.20) = 1 .0 

o- 2 = nir(1 - tt) = 5(.20)(1 - .20) = .80 
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La media de 1 .0 y la varianza de 0.80 se verifican con las fórmulas (6-1) y (6-2). La distri- 
bución de probabilidad del resultado de Excel de la página anterior, así como los detalles de 
los cálculos, aparecen a continuación. 


Número de vuelos 
retrasados, 

X 

P(x) 

xP(x) 

X — |JL 

CN 

1 

(X - M.) Z P(X) 

0 

0.3277 

0.0000 

-1 

1 

0.3277 

1 

0.4096 

0.4096 

0 

0 

0 

2 

0.2048 

0.4096 

1 

1 

0.2048 

3 

0.0512 

0.1536 

2 

4 

0.2048 

4 

0.0064 

0.0256 

3 

9 

0.0576 

5 

0.0003 

0.0015 

4 

16 

0.0048 



(JL = 1.0000 



cr 2 = 0.7997 


Tablas de probabilidad binomial 

Con la fórmula (6-3) se construye una distribución de probabilidad binomial para cualesquiera 
valores de n y tt. Sin embargo, si n es grande, los cálculos consumen más tiempo. Por con- 
veniencia, las tablas del apéndice B.9 muestran el resultado de la aplicación de la fórmula en 
el caso de varios valores de n y tt. La tabla 6-2 muestra parte del apéndice B.9 para n = 6 y 
diversos valores de -tt. 


TABLA 6-2 Probabilidades binomiales para n = 6 y valores selecccionados de tt 


n = 6 
Probabilidad 


xW 

.05 

.1 

.2 

.3 

.4 

.5 

.6 

.7 

.8 

.9 

.95 

0 

| .735 1 

.531 

.262 

.118 

.047 

.016 

.004 

.001 

.000 

.000 

.000 

1 

.232 

.354 

.393 

.303 

.187 

.094 

.037 

.010 

.002 

.000 

.000 

2 

.031 

.098 

.246 

.324 

.311 

.234 

.138 

.060 

.015 

.001 

.000 

3 

.002 

.015 

.082 

.185 

.276 

.313 

.276 

.185 

.082 

.015 

.002 

4 

.000 

.001 

.015 

.060 

.138 

.234 

.311 

.324 

.246 

.098 

.031 

5 

.000 

.000 

.002 

.010 

.037 

.094 

.187 

.303 

.393 

.354 

.232 

6 

.000 

.000 

.000 

.001 

.004 

.016 

.047 

.118 

.262 

.531 

.735 



Cinco por ciento de los engranajes de tornillo producidos en una fresadora automática de alta 
velocidad Carter-Bell se encuentra defectuoso. ¿Cuál es la probabilidad de que, en seis engra- 
najes seleccionados, ninguno se encuentre defectuoso? ¿Exactamente uno? ¿Exactamente 
dos? ¿Exactamente tres? ¿Exactamente cuatro? ¿Exactamente cinco? ¿Exactamente seis de 
seis? 

Las condiciones binomiales se cumplen: a) hay sólo dos posibles resultados (un engranaje 
determinado está defectuoso o es aceptable); b) existe una cantidad fija de ensayos (6); c) hay 
una probabilidad constante de éxito (0.05); d) los ensayos son independientes. 

Consulte la tabla 6-2 y localice la probabilidad de que exactamente cero engranajes se 
encuentren defectuosos. Descienda por el margen izquierdo hasta llegar al valor 0 dex. Ahora 
siga por la horizontal hasta la columna con un encabezado tt de 0.05 para determinar la pro- 
babilidad. Ésta es de 0.735. 

La probabilidad de que haya exactamente un engranaje defectuoso en una muestra de seis 
engranajes de tornillo es de 0.232. La distribución de probabilidad completa de n = 6 y tt = 
0.05 es la siguiente: 
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Número de 

Probabilidad 

engranajes 

de que 

defectuosos, 

ocurra, 

X 

P(x) 

0 

.735 

i 

.232 

2 

.031 

3 

.002 


Número de 

Probabilidad 

engranajes 

de que 

defectuosos, 

ocurra, 

X 

P(x) 

4 

.000 

5 

.000 

6 

.000 




Por supuesto, existe una ligera posibilidad de que salgan cinco engranajes defectuosos de 
seis selecciones aleatorias. Ésta es de 0.00000178, que se determina al sustituir los valores 
adecuados en la fórmula binomial: 

P( 5) = sCgCOS) 5 ^) 1 = (6)(.05)%95) = .00000178 

En el caso de seis de seis, la probabilidad exacta es de 0.000000016. Por consiguiente, la pro- 
babilidad de seleccionar cinco o seis engranajes defectuosos de una muestra de seis es muy 
pequeña. 

Es posible calcular la media o valor esperado de la distribución del número de engranajes 
defectuosos: 


p, = rnr = (6)(.05) = 0.30 
o- 2 = mr(1 - -tt) = 6(.05)(.95) = 0.285 


El software MegaStat también calcula las probabilidades de una distribución binomial. A 
continuación aparece la captura de pantalla del ejemplo anterior. En MegaStat, p se utiliza para 
representar el éxito en lugar de tt. También se incluyen la probabilidad acumulada, valor espe- 
rado, varianza y desviación estándar. 
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Ocho por ciento de los empleados de la planta de General Mills en Laskey Road recibe su sueldo 
bimestral por medio de transferencias de fondos electrónicos. Este mecanismo también recibe el 
nombre de depósito directo. Suponga que selecciona una muestra aleatoria de siete empleados. 

a) ¿Esta situación cumple los supuestos de la distribución binomial? 

b) ¿Cuál es la probabilidad de que a los siete empleados se les haga un depósito directo? 

c) Aplique la fórmula (6-3) para determinar la probabilidad exacta de que a cuatro de los siete em- 
pleados de la muestra se les haga un depósito directo. 

d) De acuerdo con el apéndice B.9, verifique sus respuestas a los incisos b) y c). 
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El apéndice B.9 es limitado; ofrece probabilidades para valores de n de 1 a 1 5, y para valo- 
res de tt de 0.05, 0.10, ..., 0.90 y 0.95. Un programa de software puede generar las probabi- 
lidades de un número específico de éxitos, dados n y tt. La captura de pantalla Excel que apa- 
rece a continuación muestra la probabilidad cuando n = 40 y tt = 0.09. Observe que el núme- 
ro de éxitos se detiene en 15, pues las probabilidades de 16 a 40 se aproximan mucho a 0. 
Las instrucciones se detallan en la sección Comandos de Software en la página 219. 

Se deben mencionar otras cuestiones adicionales relacionadas con la distribución de pro- 
babilidad binomial. 

1. Si n permanece igual y tt se incrementa de 0.05 a 0.95, la forma de la distribución cam- 
bia. Observe la tabla 6-3 y la gráfica 6-2. Las probabilidades de que tt sea 0.05 presentan 
un sesgo positivo. Conforme tt se aproxima a 0.50, la distribución se torna más simétrica. 
A medida que tt sea mayor a 0.50 y se aproxime a 0.95, la distribución de probabilidad 
adquiere un sesgo negativo. La tabla 6-3 destaca las probabilidades de n = 10 y valores 
de tt de 0.05, 0.10, 0.20, 0.50 y 0.70. Las gráficas de estas distribuciones de probabilidad 
se muestran en la gráfica 6-2. 


TABLA 6-3 Probabilidad de 0, 1, 2, ... éxitos para valores de tt de 0.05, 0.10, 0.20, 0.50 y 0.70 
con una n de 10 



p M 



01 2345678910 01 2345678910 0 1 2 3 4 5 6 7 8 910 0 1 2 3 4 5 6 7 8 910 0 1 2 3 4 5 6 7 8 910 


X X X X X 

Éxitos Éxitos Éxitos Éxitos Éxitos 


GRAFICA 6-2 Representación gráfica de la distribución de probabilidad binomial para valores de tt 
de 0.05, 0.10, 0.20, 0.50 y 0.70 con una n de 10 


2. Si tt, la probabilidad de éxito, conserva el mismo valor, pero n aumenta, la forma de la dis- 
tribución binomial se torna más simétrica. La gráfica 6-3 muestra el caso en el que tt per- 
manece constante en 0.10, pero n se incrementa de 7 a 40. 
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P(x) 
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GRÁFICA 6-3 Representación gráfica de la distribución de probabilidad binomial para valores 
tt de 0.10 y n de 7, 12, 20 y 40 

Ejercicios 

9. En una situación binomial, n = 4 y ir = 0.25. Determine las probabilidades de los siguientes even- 
tos usando la fórmula binomial. 

a) x = 2 

b) x = 3 

10. En una situación binomial, n = 5 y ir = 0.40. Determine las probabilidades de los siguientes even- 
tos usando la fórmula binomial. 

a) x = 1 

b) x = 2 

11. Suponga una distribución binomial en la que n = 3 y tt = 0.60. 

a) Consulte el apéndice B.9 y elabore una lista de probabilidades para valores de x de 0 a 3. 

b) Determine la media y la desviación estándar de la distribución a partir de las definiciones gene- 
rales de las fórmulas (6-1) y (6-2). 

12. Suponga que existe una distribución binomial en ia que n = 5 y tt = 0.30. 

a) Consulte el apéndice B.9 y elabore una lista de probabilidades para valores de x de 0 a 5. 

b) Determine la media y la desviación estándar de la distribución a partir de las definiciones gene- 
rales de las fórmulas (6-1) y (6-2). 

13. Un estudio de la American Society of Investors descubrió que 30% de inversionistas particulares 
había utilizado un agente de descuentos. En una muestra aleatoria de nueve personas, ¿cuál es la 
probabilidad de que: 

a) exactamente dos personas hayan utilizado un agente de descuentos? 

b) exactamente cuatro personas hayan recurrido a él? 

c) ninguna persona lo haya empleado? 

14. El Servicio Postal de Estados Unidos informa que 95% de la correspondencia de primera clase 
dentro de la misma ciudad se entrega en un periodo de dos días a partir del momento en que se 
envía. Se enviaron seis cartas de forma aleatoria a diferentes lugares. m 

a) ¿Cuál es la probabilidad de que las seis lleguen en un plazo de dos días? 

£>) ¿Cuál es la probabilidad de que exactamente cinco lleguen en un plazo de dos días? 

c) Determine la media del número de cartas que llegarán en un plazo de dos días. 

d) Calcule la varianza y la desviación estándar del número de cartas que llegarán en un plazo de 
dos días. 

15. Las normas de la industria sugieren que 10% de ios vehículos nuevos requiere un servicio de 
garantía durante el primer año. El día de ayer, Jones Nissan, de Sumter, Carolina del Sur, vendió 
12 automóviles marca Nissan. 

a) ¿Cuál es la probabilidad de que ninguno de estos vehículos requiera servicio de garantía? 

b) ¿Cuál es la probabilidad de que exactamente uno de estos vehículos requiera servicio de 
garantía? 
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c) Determine la probabilidad de que exactamente dos de estos vehículos requiera servicio de 
garantía. 

d) Calcule la media y la desviación estándar de esta distribución de probabilidad. 

16. Un agente de telemarketing hace seis llamadas por hora y es capaz de hacer una venta con 30% 
de estos contactos. Para las siguientes dos horas, determine: m 

a) la probabilidad de realizar exactamente cuatro ventas; 

b) la probabilidad de no realizar ninguna venta; 

c) la probabilidad de hacer exactamente dos ventas; 

d) la media de la cantidad de ventas durante un periodo de dos horas. 

17. Una encuesta reciente de la American Accounting Association reveló que 23% de los estudiantes 
graduados en contabilidad elige la contaduría pública. Suponga que elige una muestra de 15 
recién graduados. m 

a) ¿Cuál es la probabilidad de que dos hayan elegido contaduría pública? 

b ) ¿Cuál es la probabilidad de que cinco hayan elegido contaduría pública? 

c) ¿Cuántos graduados esperaría que eligieran contaduría pública? 

18 . Se reporta que 16% de los hogares estadounidenses utilizan exclusivamente un teléfono celu- 
lar como servicio telefónico. En una muestra de ocho hogares, encuentra la probabilidad de 
que: 

a) Ninguno use un celular como su servicio exclusivo. 

b) Cuando menos uno use sólo el celular. 

c) Cuando menos cinco usen el celular. 

Distribuciones de probabilidad binomial acumulada 

Tal vez desee conocer la probabilidad de adivinar la respuesta a 6 o más preguntas de verda- 
dero o falso de un total de 10. O quizás esté interesado en la probabilidad de seleccionar, en 
forma aleatoria, menos de dos artículos defectuosos en la producción de la hora anterior. En 
estos casos necesita distribuciones de frecuencia acumulada similares a las del capítulo 2 (vea 
la p. 42). El siguiente ejemplo ilustra este hecho. 


Cjemplo 


Solución 


Un estudio del Departamento de Transporte de Illinois concluyó que 76.2% de quienes ocupa- 
ban los asientos delanteros de los vehículos utilizaba cinturón de seguridad. Esto significa que 
los dos ocupantes de la parte delantera utilizaban cinturones de seguridad. Suponga que deci- 
de comparar la información con el uso actual que se da al cinturón de seguridad. Seleccione 
una muestra de 12 vehículos. 

1 . ¿Cuál es la probabilidad que los ocupantes de la parte delantera en exactamente 7 de los 
12 vehículos seleccionados utilicen cinturones de seguridad? 

2. ¿Cuál es la probabilidad que los ocupantes de la parte delantera de por lo menos 7 de los 
12 vehículos utilicen cinturón de seguridad? 

Esta situación satisface los requisitos binomiales. 

En un vehículo en particular, ambos ocupantes de la parte delantera utilizan cinturón de 
seguridad o no lo hacen. Sólo hay dos posibles resultados. 

Existe una cantidad fija de ensayos, 12 en este caso, pues se verifican 12 vehículos. 

La probabilidad de un éxito (los ocupantes utilizan cinturón de seguridad) es la misma de 
un vehículo al siguiente: 76.2 por ciento. 

Los ensayos son independientes. Si, en el cuarto vehículo seleccionado, todos los ocu- 
pantes utilizan cinturón de seguridad, esto no influye en los resultados del quinto o déci- 
mo vehículos. 

Para determinar la probabilidad de que los ocupantes de exactamente 7 vehículos de la mues- 
tra utilicen cinturón de seguridad, aplique la fórmula (6-3). En este caso, n = 12 y ir = 0.762. 

P(x = 7|n = 12 y ir = .762) 

= 12 C 7 (.762) * 1 2 * * * * 7 * * * * (1 - .762) 12 ~ 7 = 792(.149171)(.000764) = .0902 

De esta manera, se concluye que la probabilidad de que los ocupantes de exactamente 7 de 

los 12 vehículos de la muestra utilicen cinturones de seguridad es de aproximadamente 9%. 
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Como se hizo en esta ecuación, con frecuencia se emplea una barra | para dar a entender dado 
que. Así, en esta ecuación se trata de conocer la probabilidad de que x sea igual a 7 dado que 
el número de ensayos es de 12 y la probabilidad de un éxito es de 0. 762. 

Para determinar la probabilidad de que los ocupantes de 7 o más de los vehículos utilicen 
su cinturón de seguridad, aplique la fórmula (6-3) de este capítulo, así como la regla especial 
de la adición del capítulo anterior [vea fórmula (5-2), p. 153]. 

Como los eventos son mutuamente excluyentes (lo cual significa que una muestra de 12 
vehículos no puede tener un total de 7 ni, al mismo tiempo, un total de 8 vehículos en que 
los ocupantes utilizan cinturón de seguridad), se determina la probabilidad de que en 7 de 
ellos los ocupantes utilizan cinturón de seguridad; la probabilidad de que en 8 de los vehícu- 
los los ocupantes utilicen cinturones de seguridad y, así sucesivamente, la probabilidad de que 
en los 12 vehículos de la muestra los ocupantes están utilizando cinturón de seguridad. La pro- 
babilidad de cada uno de estos resultados se suma en seguida. 

P(x > 7|n = 12 y tt = .762) 

= P(x = 7) + P(x = 8) + P(x = 9) + P(x = 10) + P(x = 1 1) + P(x = 12) 

= .0902 + .1805 + .2569 + .2467 + .1436 + .0383 
= .9562 

De esta manera, la probabilidad de seleccionar 12 automóviles y hallar que los ocupantes de 7 
o más vehículos utilizaban cinturón de seguridad es de 0.9562. Esta información se muestra en 
la siguiente hoja de cálculo de Excel. Existe una pequeña diferencia en la respuesta con soft- 
ware como consecuencia del redondeo. Los comandos de Excel son similares a los que se 
indican en la página 219, punto 2. 


•áCurmilative birtomiat 



Suma de 
probabilidades 
de 7 éxitos o más 



Si n = 4 y -ir = 0.60, determine la probabilidad de los siguientes eventos. 

a) x = 2. 

b ) x < 2. 

c) x > 2. 


"N 


comed: 


Ejercicios 

19. En una distribución binomial, n = 8 y tt = 0.30. Determine las probabilidades de los siguientes 
eventos. 

a) x = 2. 

b) x s 2 (la probabilidad de que x sea igual o menor que 2). 

c) x > 3 (la probabilidad de que x sea igual o mayor que 3). 
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OA6 Describir y calcular las 
probabilidades en una 
distribución hipergeométrica. 


20 . En una distribución binomial, n = 12 y ir = 0.60. Determine las probabilidades de los siguientes 
eventos. 

a) x = 5. 

b) x < 5. 

c) x > 6. 

21 . En un estudio reciente se descubrió que 90% de las familias de Estados Unidos tiene televisores 
de pantalla grande. En una muestra de nueve familias, ¿cuál es la probabilidad de que: ^ 

a) las nueve tengan televisores de pantalla grande? 

b) menos de cinco tengan televisores de pantalla grande? 

c) más de cinco tengan televisores de pantalla grande? 

d) al menos siete familias tengan televisores de pantalla grande? 

22 . Un fabricante de marcos para ventanas sabe, por experiencia, que 5% de la producción tendrá 
algún tipo de defecto menor, que requerirá reparación. ¿Cuál es la probabilidad de que en una 
muestra de 20 marcos: m 

a) ninguno requiera reparación? 

b) por lo menos uno requiera reparación? 

c) más de dos requieran reparación? 

23 . La rapidez con la que las compañías de servicios resuelven problemas es de suma importancia. 
Georgetown Telephone Company afirma que es capaz de resolver 70% de los problemas de los 
clientes el mismo día en que se reportan. Suponga que los 15 casos que se reportaron el día de 
hoy son representativos de todas las quejas. ^ 

a) ¿Cuántos problemas esperaría que se resolvieran el día de hoy? ¿Cuál es la desviación es- 
tándar? 

b) ¿Cuál es la probabilidad de que 10 problemas se resuelvan el día de hoy? 

c) ¿Cuál es la probabilidad de que 10 u 1 1 problemas se resuelvan el día de hoy? 

d) ¿Cuál es la probabilidad de que más de 10 problemas se resuelvan el día de hoy? 

24 . Se afirma que 80% de los autos que se aproximan a una caseta individual de peaje en Nueva 
Jersey están equipados con un transponder E-ZPass. Encuentre la probabilidad de que en una 
muestra de seis autos: 

a) Todos tendrán transponder. 

b) Cuando menos tres tendrán transponder. 

c) Ninguno tendrá transponder. 

6.6 Distribución de probabilidad hipergeométrica 

Para aplicar una distribución binomial, la probabilidad de que ocurra un éxito debe permane- 
cer igual en cada ensayo. Por ejemplo, la probabilidad de adivinar la respuesta correcta a una 
pregunta de verdadero o falso es de 0.50. Esta probabilidad es igual para cada pregunta de 
un examen. Asimismo, suponga que 40% de los electores registrados en un distrito electoral 
es republicano. Si se seleccionan al azar 27 de los votantes registrados, la probabilidad de ele- 
gir a un republicano en la primera selección es de 0.40. La posibilidad de elegir a un republi- 
cano en la siguiente selección es de 0.40, tomando en cuenta que el muestreo incluye reem- 
plazo, lo cual significa que la persona elegida vuelve a la población antes de elegir a la que 
sigue. 

No obstante, la mayor parte del muestreo se realiza sin reemplazos. Por lo tanto, si la 
población es pequeña, la probabilidad de cada observación cambiará. Por ejemplo, si la po- 
blación consta de 20 elementos, la probabilidad de seleccionar un elemento de ella es de 1/20. 
Si el muestreo se realiza sin reemplazos, sólo quedan 19 elementos después de la primera 
selección; la probabilidad de seleccionar un elemento en la segunda selección es de sólo 1 /1 9. 
En la tercera selección, la probabilidad es de 1/18, etc. Esto supone que la población es fini- 
ta; es decir, se conoce el número de elementos de la población, que es relativamente reduci- 
do. Ejemplos de poblaciones finitas son los 2 842 republicanos de un distrito electoral, las 
9 421 solicitudes para la escuela de medicina y los 18 Dakota 4x4 Crew Crabs 2010 actual- 
mente en existencia en Helfman Dodge Chrysler Jeep en Houston, Texas. 

Recuerde que uno de los criterios relacionados con la distribución binomial estriba en que 
la probabilidad de éxito debe permanecer igual en todos los ensayos. Como la probabilidad 
de éxito no es la misma en todos los ensayos cuando se realiza un muestreo sin reemplazo en 
una población relativamente pequeña, no debe aplicarse la distribución binomial. En lugar de 
ésta se aplica la distribución hipergeométrica. Por lo tanto, 1) si se selecciona una muestra 
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Cjemplo 


Solución 


de una población finita sin reemplazo y 2) si el tamaño de la muestra n es mayor que 5% del 
tamaño de la población N, se aplica la distribución hipergeométrica para determinar la proba- 
bilidad de un número específico de éxitos o fracasos. Esto resulta especialmente apropiado 
cuando el tamaño de la población es pequeño. 

La fórmula de la distribución de probabilidad hipergeométrica es la siguiente: 


DISTRIBUCIÓN HIPERGEOMÉTRICA 


P(x) 


(sC x )(fv-sC n - x ) 

N^n 


( 6 - 6 ) 


donde: 

N representa el tamaño de la población. 

S es el número de éxitos en la población. 

x es el número de éxitos en la muestra; éste puede asumir los valores 0, 1, 2, 3... 
n es el tamaño de la muestra o el número de ensayos. 

C es el símbolo de combinación. 

En resumen, una distribución de probabilidad hipergeométrica tiene las siguientes carac- 
terísticas: 


x : : "n 

DISTRIBUCION DE PROBABILIDAD HIPERGEOMETRICA 

1 . Los resultados de cada ensayo de un experimento se clasifican en dos categorías exclu- 
sivas: éxito o fracaso. 

2. La variable aleatoria es el número de éxitos de un número fijo de ensayos. 

3. Los ensayos no son independientes. 

4. Los muéstreos se realizan con una población finita sin reemplazo y n/N > 0.05. Por lo 
tanto, la probabilidad de éxito cambia en cada ensayo. 

V J 


El siguiente ejemplo ilustra los detalles para determinar una probabilidad con la distribu- 
ción de probabilidad hipergeométrica. 


Play Time Toys, Inc., tiene 50 empleados en el 
departamento de ensamblado. Sólo cuarenta de 
ellos pertenecen al sindicato. Se eligen al azar 
cinco empleados para formar un comité que ha- 
blará con la empresa sobre los horarios de inicio 
de los turnos. ¿Cuál es la probabilidad de que 
cuatro de los cinco empleados elegidos para for- 
mar parte del comité pertenezcan a un sindicato? 


En este caso, la población consiste en los 50 
empleados del departamento de ensamblado. Só- 
lo se puede elegir una vez a un empleado para 
formar parte del comité. De ahí que el muestreo se lleve a cabo sin reemplazo. Por lo tanto, en 
cada ensayo cambia la probabilidad de elegir a un empleado sindicalizado. La distribución 
hipergeométrica es adecuada para determinar la probabilidad. En este problema, 

N es igual a 50, el número de empleados. 

S tiene un valor de 40, el número de empleados sindicalizados. 
x es igual a 4, el número de empleados sindicalizados elegidos. 
n vale 5, el número de empleados elegidos. 





206 


CAPÍTULO 6 Distribuciones de probabilidad discreta 



Se desea calcular la probabilidad de que 4 de los 5 miembros del comité sean sindicaliza- 
dos. Al sustituir estos valores en la fórmula (6-6), se obtiene: 


P( 4) = 


(4oC 4 )(5 0 -4oC5-4) (91390X10) 

snC B 2 118 760 


= .431 


Por consiguiente, la probabilidad de elegir al azar a 5 trabajadores de ensamblado de los 50 
trabajadores y encontrar que 4 de 5 son sindicalizados es de 0.431 . 


La tabla 6-4 muestra las probabilidades hlpergeométricas de encontrar 0, 1, 2, 3, 4 y 5 
empleados sindicalizados en el comité. 


TABLA 6-4 Probabilidades hipergeométricas (n=5,N = 50yS = 40) del número de empleados 
sindicalizados en el comité 


Miembros de un sindicato 

Probabilidad 

0 

.000 

1 

.004 

2 

.044 

3 

.210 

4 

.431 

5 

.311 


1.000 


Con el fin de comparar las dos distribuciones de probabilidad, la tabla 6-5 muestra las proba- 
bilidades hipergeométricas y binomiales del ejemplo de Play Time Toys, Inc. Como 40 de los 
50 empleados del departamento de ensamblado están sindicalizados, establecemos que tt = 
0.80 para la distribución binomial. Las probabilidades binomiales de la tabla 6-5 provienen de 
la distribución binomial con n = 5 y tt = 0.80. 


TABLA 6-5 Probabilidades hipergeométrica y binomial del departamento de ensamble 
de PlayTime Toys, Inc. 


Número de miembros 
sindicalizados en el comité 

Probabilidad 
hipergeométrica, P(x) 

Probabilidad binomial 
(n = 5 y tt = 0.80) 

0 

.000 

.000 

1 

.004 

.006 

2 

.044 

.051 

3 

.210 

.205 

4 

.431 

.410 

5 

.311 

.328 


1.000 

1.000 



Cuando no es posible satisfacer alguno de los requisitos binomiales de una probabilidad 
constante de éxito, se debe recurrir a la distribución de probabilidad hipergeométrica. No obs- 
tante, según lo indica la tabla 6-5, es posible, en ciertas condiciones, emplear los resultados 
de la distribución binomial para calcular la distribución hipergeométrica. Esto conduce a la 
siguiente regla empírica: 

Si los elementos seleccionados no se regresan a la población, se puede aplicar la dis- 
tribución binomial para calcular la distribución hipergeométrica cuando n < 0.05/V. Es 
decir, basta la distribución binomial si el tamaño de la muestra es menor que 5% de la 
población. 

En Excel es posible generar una distribución hipergeométrica. Observe la captura de pan- 
talla a la Izquierda. En la sección Comandos de Software en la página 219 al final del capítulo 
se incluyen los pasos pertinentes. 
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Horwege Discount Brokers hace planes para contratar este año a 5 analistas financieros. Hay un 
grupo de 12 candidatos aprobados, y George Horwege, el propietario, decide elegir al azar a quie- 
nes va a contratar. De los solicitantes aprobados, 8 son hombres y 4 mujeres. ¿Cuál es la probabili- 
dad de que 3 de los 5 contratados sean hombres? 


comed: 


Ejercicios 

25. Una población consta de 1 0 elementos, 6 de los cuales se encuentran defectuosos. En una mues- 
tra de 3 elementos, ¿cuál es la probabilidad de que exactamente 2 sean defectuosos? Suponga 
que las muestras se toman sin reemplazo. 

26. Una población consta de 1 5 elementos, 1 0 de los cuales son aceptables. En una muestra de 4 ele- 
mentos, ¿cuál es la probabilidad de que exactamente 3 sean aceptables? Suponga que las mues- 
tras se toman sin reemplazo. 

27. Kolzak Appliance Outlet acaba de recibir un cargamento de 10 reproductores de DVD. Poco des- 
pués de recibirlo, el fabricante se comunicó para reportar un envío de tres unidades defectuosas. 
La señorita Kolzac, propietaria de la tienda, decidió probar 2 de los 10 reproductores de DVD que 
recibió. ¿Cuál es la probabilidad de que ninguno de los 2 reproductores de DVD que se probaron 
esté defectuoso? Suponga que las muestras no tienen reemplazo. 

28. El departamento de sistemas de computación cuenta con ocho profesores, de los cuales seis son 
titulares. La doctora Vonder, directora, desea formar un comité de tres profesores del departamen- 
to con el fin de que revisen el plan de estudios. Si selecciona el comité al azar: 

a) ¿Cuál es la probabilidad de que todos los miembros del comité sean titulares? 

b) ¿Cuál es la probabilidad de que por lo menos un miembro del comité no sea titular? ( Suge- 
rencia : Aplique la regla del complemento para responder esta pregunta.) 

29. Keith’s Florists tiene 15 camiones de entrega, que emplea sobre todo para entregar flores y arre- 
glos florales en la zona de Greenville, Carolina del Sur. De estos 15 camiones, 6 presentan proble- 
mas con los frenos. En forma aleatoria se seleccionó una muestra de 5 camiones. ¿Cuál es la pro- 
babilidad de que 2 de los camiones probados presenten frenos defectuosos? 

30. El juego de Lotto, patrocinado por la Comisión de la Lotería de Louisiana, otorga el premio mayor 
a un concursante que hace coincidir 6 de los posibles números. Suponga que hay 40 pelotas de 
ping-pong numeradas del 1 al 40. Cada número aparece una sola vez y las pelotas ganadoras se 
seleccionan sin reemplazo. 

a) La comisión informa que la probabilidad de que coincidan todos los números es de 1 en 
3 838 380. ¿Qué significa esto en términos de probabilidad? 

b) Aplique la fórmula de la distribución de probabilidad hipergeométrica para determinar esta pro- 
babilidad. 

La comisión de la lotería también otorga un premio si un concursante hace coincidir 4 o 5 de los 
6 números ganadores. Sugerencia: Divida los 40 números en dos grupos: números ganadores y 
no ganadores. 

c) Calcule la probabilidad, de nuevo con la fórmula de la distribución de probabilidad hipergeo- 
métrica, para hacer coincidir 4 de los 6 números ganadores. 

d) Calcule la probabilidad de que coincidan 5 de los 6 números ganadores. 


6.7 Distribución de probabilidad de Poisson 

OA7 Describir y calcular las La distribución de probabilidad de Poisson describe el número de veces que se presenta 
probabilidades de una un evento durante un intervalo específico. El intervalo puede ser de tiempo, distancia, área o 

distribución de Poisson. volumen. 

La distribución se basa en dos supuestos. El primero consiste en que la probabilidad es 
proporcional a la longitud del intervalo. El segundo supuesto consiste en que los intervalos son 
independientes. En otras palabras, cuanto más grande sea el intervalo, mayor será la proba- 
bilidad; además, el número de veces que se presenta un evento en un intervalo no influye en 
los demás intervalos. La distribución también constituye una forma restrictiva de la distribu- 
ción binomial cuando la probabilidad de un éxito es muy pequeña y n es grande. A ésta se le 
conoce por lo general con el nombre de ley de eventos improbables, lo cual significa que la 
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Estadística en acción 

Cerca del final de la 
Segunda Guerra 
Mundial, los alemanes 
crearon bombas propul- 
sadas por cohetes, que 
lanzaron hacia la ciudad 
de Londres. El comando 
militar aliado no sabía si 
estas bombas se lanzaban 
de forma aleatoria o si 
tenían un objetivo. Con 
el fin de averiguarlo, se 
dividió la ciudad de 
Londres en 586 regiones 
cuadradas. Se registró la 
distribución de los bom- 
bardeos en cada región 
cuadrada de la siguiente 


Bombardeos 


0 1 2 

3 4 5 

Regiones 


229 221 93 

35 7 1 


Con el fin de interpretar 
estos datos, la tabla ante- 
rior señala que 229 regio- 
nes no fueron bom- 
bardeadas. Siete regiones 
fueron atacadas cuatro 
veces. De acuerdo con la 
distribución de Poisson, 
con una media de 0.93 
bombardeos por región, 
se obtiene la siguiente 
cantidad esperada de 
bombardeos: 

Bombardeos 

0 1 2 3 4 5 o 

más 

Regiones 

231.2 215.0 100.0 31.0 7.2 1.6 

Puesto que la cantidad 
real de bombardeos se 
aproxima a la cantidad 
esperada, el comando 
militar llegó a la conclu- 
sión de que las bombas 
caían de forma aleatoria. 
Los alemanes no habían 
creado una bomba con 
un dispositivo para dar 
en el blanco. 


probabilidad, -tt, de que ocurra un evento en particular es muy pequeña. La distribución de 
Poisson es una distribución de probabilidad discreta porque se genera contando. 

En resumen, una distribución de probabilidad de Poisson posee tres características: 


f ' 

EXPERIMENTO DE PROBABILIDAD DE POISSON 

1 . La variable aleatoria es el número de veces que ocurre un evento durante un intervalo 
definido. 

2. La probabilidad de que ocurra el evento es proporcional al tamaño del intervalo. 

3. Los intervalos no se superponen y son independientes. 


Esta distribución posee diversas aplicaciones. Se le utiliza como modelo para describir la dis- 
tribución de errores en una entrada de datos, el número de rayones y otras imperfecciones en 
las cabinas de automóviles recién pintados, el número de partes defectuosas en envíos, el 
número de clientes que esperan mesa en un restaurante o que esperan entrar en una de las 
atracciones de Disney World y el número de accidentes en la carretera federal 1-75 en un perio- 
do de tres meses. 

La distribución de Poisson se describe matemáticamente por medio de la siguiente fór- 
mula: 


DISTRIBUCIÓN DE POISSON 


P(x) 


x! 


( 6 - 7 ) 


y 


donde: 

|jl (mu) es la media de la cantidad de veces (éxitos) que se presenta un evento en un 
intervalo particular. 

e es la constante 2.71828 (base del sistema de logaritmos nepeñanos). 
x es el número de veces que se presenta un evento. 

P(x) es la probabilidad de un valor específico de x. 


La media de número de éxitos, |x, puede determinarse con mr, en este caso, n es el número 
total de ensayos, y tt, la probabilidad de éxito. 


I 


MEDIA DE UNA DISTRIBUCION DE POISSON 


|X = Dtt 


( 6 - 8 ) 


La varianza de Poisson también es igual a su media. Si, por ejemplo, la probabilidad de que 
un cheque cobrado en un banco rebote es de 0.0003 y se cobran 10 000 cheques, la media y 
la varianza del número de cheques rebotados es de 3.0, que se determina mediante la opera- 
ción [x — r?Tr — 1 0 000(.0003) = 3.0. 

Recuerde que, en el caso de una distribución binomial, existe una cantidad fija de ensa- 
yos. Por ejemplo, en una prueba de opción múltiple de cuatro preguntas, sólo puede haber 
cero, uno, dos, tres o cuatro éxitos (respuestas correctas). Sin embargo, la variable aleatoria, 
x, en el caso de una distribución de Poisson puede adoptar una infinidad de valores ; es decir, 
0, 1 , 2, 3, 4, 5 No obstante, las probabilidades se tornan muy bajas después de las prime- 

ras veces que se presenta un evento (éxitos). 

Para ejemplificar el cálculo de la distribución de Poisson, suponga que pocas veces se 
pierde equipaje en Delta Airlines. En la mayoría de los vuelos no se pierden maletas; en algu- 
nos se pierde una; en unos cuantos se pierden dos; pocas veces se pierden tres, etc. Suponga 
que una muestra aleatoria de 1 000 vuelos arroja un total de 300 maletas perdidas. De esta 
manera, la media aritmética del número de maletas perdidas por vuelo es de 0.3, que se calcu- 
la al dividir 300/1 000. Si el número de maletas perdidas por vuelo se rige por una distribución 
de Poisson con |x = 0.3, las diversas probabilidades se calculan con la fórmula (6-7): 


P(x) = 


x! 


Por ejemplo, la probabilidad de que no se pierda ninguna maleta es la siguiente: 

(0.3)°(e~°- 3 ) 
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Cjemplo 


Solución 


En otras palabras, en 74% de los vuelos no habrá maletas perdidas. La probabilidad de que 
se pierda exactamente una maleta es: 


P( 1 ) 


(o.^V 0 - 3 ) 

1! 


0.2222 


Por consiguiente, se espera que se pierda exactamente una maleta en 22% de los vuelos. 
Las probabilidades de Poisson también se pueden consultar en el apéndice B.5. 


De acuerdo con el ejemplo anterior, el número de maletas se rige por una distribución de 
Poisson con una media de 0.3. Consulte el apéndice B.5 para determinar la probabilidad 
de que ninguna maleta se pierda en un vuelo. ¿Cuál es la probabilidad de que se pierda exac- 
tamente una maleta en un vuelo? ¿En qué momento debe sospechar el supervisor de que en 
un vuelo se están perdiendo demasiadas maletas? 

Parte del apéndice B.5 se reproduce en la tabla 6-6. Para determinar la probabilidad de que 
ninguna maleta se pierda, se localiza la columna con el encabezado “0.3” y se desciende por 
dicha columna hasta el renglón señalado con “0”. La probabilidad es de 0.7408. Ésta es la pro- 
babilidad de que no haya maletas perdidas. La probabilidad de que se pierda una maleta es 
0.2222, y está en el siguiente renglón de la tabla, en la misma columna. La probabilidad de que 
se pierdan dos maletas es de 0.0333, renglón inferior; en el caso de tres maletas perdidas, la 
probabilidad es de 0.0033; y en el de cuatro maletas perdidas es de 0.0003. Por consiguiente, 
un supervisor no debería sorprenderse de que se pierda una maleta, pero debería esperar ver 
con menos frecuencia más de una maleta perdida. 


TABLA 6-6 Tabla de Poisson para diversos valores de /a, (del apéndice B.5) 



Estas probabilidades también se determinan con el sistema Minitab. Los comandos que 
se requieren se incluyen al final del capítulo. 
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Cjemplo 


Solución 


Ya se mencionó que la distribución de probabilidad de Poisson constituye una forma restricti- 
va de la distribución binomial. Es decir, se puede calcular una probabilidad binomial con la de 
Poisson. 

La distribución de probabilidad de Poisson se caracteriza por el número de veces que se 
presenta un evento durante un intervalo. Algunos ejemplos son: 

• El número de palabras mal escritas por página en un periódico. 

• El número de llamadas por hora que recibe Dyson Vacuum Cleaner Company. 

• El número de vehículos que vende por día Hyatt Buick GMC, en Durham, Carolina del 

Norte. 

• El número de anotaciones en un encuentro de fútbol colegial. 

En cada uno de estos ejemplos existe algún tipo de intervalo: palabras mal escritas por 
página, llamadas por hora, vehículos vendidos por día o anotaciones por partido. 

En el ejemplo anterior (el número de maletas perdidas en cada vuelo), el intervalo es un 
vuelo. Se conocía la media del número de maletas perdidas por vuelo, pero no el número de 
pasajeros ni la probabilidad de que se perdiera una maleta. Se sospechó que el número de pa- 
sajeros era lo bastante grande y que era baja la probabilidad de que un pasajero perdiera su 
maleta. En el ejemplo siguiente se aplicó la distribución de Poisson para calcular una proba- 
bilidad binomial cuando n, el número de ensayos, es grande, y ir, la probabilidad de un éxito, 
pequeña. 


Coastal Insurance Company asegura propiedades frente a la playa a lo largo de Virginia, 
Carolina del Norte y del Sur, y las costas de Georgia; el cálculo aproximado es que, cualquier 
año, la probabilidad de que un huracán de categoría III (vientos sostenidos de más de 110 
millas por hora) o más intenso azote una región de la costa (la isla de St. Simons, Georgia, por 
ejemplo) es de 0.05. Si un dueño de casa obtiene un crédito hipotecario de 30 años por una 
propiedad recién comprada en St. Simons, ¿cuáles son las posibilidades de que experimente 
por lo menos un huracán durante el periodo del crédito? 

Para aplicar la distribución de probabilidad de Poisson, se comienza por determinar la media 
o número esperado de tormentas que se ajustan al criterio y que azotan St. Simons durante el 
periodo de 30 años. Es decir, 


|x = dtt = 30(.05) = 1.5 


Donde: 

n es el número de años, 30 en este caso. 

tt es la probabilidad de que toque tierra un huracán que se ajuste al criterio. 

(jl es la media o número esperado de tormentas en un periodo de 30 años. 

Para determinar la probabilidad de que por lo menos una tormenta azote la isla de St. Simons, 
Georgia, primero calcule la probabilidad de que ninguna tormenta azote la costa y reste dicho 
valor de 1. 


P(x > 1) = 1 - P(x = 0) = 1 - ^ — = 1 - .2231 = .7769 

Así, se concluye que las posibilidades de que un huracán de ese tipo azote la propiedad fren- 
te a la playa en St. Simons, durante el periodo de 30 años, mientras el crédito se encuentra 
vigente, son de 0.7769. En otras palabras, la probabilidad de que St. Simons sufra el azote de 
un huracán categoría III o más alta durante el periodo de 30 años es de un poco más de 75 por 
ciento. 

Se debe insistir en que el intervalo, como antes se explicó, aún existe. Es decir, se espe- 
ra que haya 1 .5 tormentas que azoten la costa cada periodo de 30 años. El intervalo es el perio- 
do de 30 años. 
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En el caso anterior se utilizó la distribución de Poisson como aproximación de la binomial. 
Note que se cumplió con las condiciones binomiales anotadas en la página 196. 


Sólo hay dos posibles resultados: un huracán azota el área de St. Simons o no lo hace. 

Hay una cantidad fija de ensayos, en este caso, 30 años. 

Existe una probabilidad constante de éxito; es decir, la probabilidad de que un huracán 
azote la zona es de 0.05 cada año. 

Los años son independientes. Esto significa que si una tormenta importante azota en el 
quinto año, esto no influye en ningún otro año. 


Para calcular la probabilidad de que por lo menos una tormenta azote el área en un perio- 
do de 30 años aplique la distribución binomial: 


P(x > 1) = 1 - P(x = 0) = 1 - 30 C 0 (.05) 0 (.95) 30 = 1 - (1 )(1 )(-21 46) = .7854 


La probabilidad de que por lo menos un huracán azote el área de St. Simons durante el 
periodo de 30 años con la distribución binomial es de 0.7854. 

¿Qué respuesta es correcta? ¿Por qué considerar el problema desde ambos puntos de 
vista? La respuesta que se obtiene con la distribución binomial es la más “técnicamente 
correcta”. La que se obtuvo con la distribución de Poisson puede tomarse como una aproxi- 
mación de la binomial, cuando n, el número de ensayos, es grande, y tt, la probabilidad de un 
éxito, pequeña. Considere el problema desde las dos distribuciones para destacar la conver- 
gencia de las dos distribuciones discretas. En ocasiones, la aplicación de la distribución de 
Poisson permite una solución más rápida y, como se ve, hay poca diferencia entre las respues- 
tas. De hecho, conforme n se torna más grande y tt más pequeña, se reducen las diferencias 
entre ambas distribuciones. 


La distribución de probabilidad de Poisson siempre tiene un sesgo positivo, y la variable 
aleatoria no posee límite superior específico. La distribución de Poisson en el caso de las 
maletas perdidas, en que |x = 0.3, está muy sesgada. Conforme |x se incrementa, la distribu- 
ción de Poisson adquiere más simetría. Por ejemplo, la gráfica 6-4 muestra las distribuciones 
del número de servicios de transmisión, reemplazos de silenciadores y cambios de aceite al 
día en Avellino’s Auto Shop. Éstas se ajustan a las distribuciones de Poisson con medias de 
0.7, 2.0 y 6.0, respectivamente. 



"O 


ü .10 
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pr = 0.7 r 1 = 2.0 


n, = 6.o 



01234 01234567 

Servicios Reemplazo de 

de transmisión silenciadores 


0 1 2 3 4 5 6 7 8 9 10 11 12 13 
Cambios de aceite 


Número de veces que se presenta el evento 


GRÁFICA 6-4 Distribuciones de probabilidad de Poisson con medias de 0.7, 2.0 y 6.0 


En resumen, la distribución de Poisson es en realidad una familia de distribuciones discre- 
Sólo se necesita p, para cons- tas. Todo lo que se requiere para construir una distribución de probabilidad de Poisson es la 
truir la distribución de Poisson media del número de defectos, errores, etc., que se designan con p,. 


212 


CAPÍTULO 6 Distribuciones de probabilidad discreta 



A partir de las tablas actuariales, Washington Insurance Company determinó que la probabilidad de 
que un hombre de 25 años muera en el transcurso del próximo año es de 0.0002. Si Washington 
Insurance vende 4 000 pólizas a hombres de 25 años durante este año, ¿cuál es la probabilidad de 
que éstos paguen exactamente una póliza? 


comed 


Ejercicios 

31. En una distribución de Poisson, p. = 0.4. 

a) ¿Cuál es la probabilidad de que x = 0? 

b) ¿Cuál es la probabilidad de que x > 0? 

32. En una distribución de Poisson, p = 4. 

a) ¿Cuál es la probabilidad de que x = 2? 

b ) ¿Cuál es la probabilidad de que x < 2? 

c) ¿Cuál es la probabilidad de que x > 2? 

33. La señorita Bergen es ejecutiva del Coast Bank and Trust. A partir de sus años de experiencia, cal- 
cula que la probabilidad de que un solicitante no pague un préstamo inicial es de 0.025. El mes 
pasado realizó 40 préstamos. 

a) ¿Cuál es la probabilidad de que no se paguen 3 préstamos? 

b) ¿Cuál es la probabilidad de que por lo menos no se paguen 3 préstamos? 

34. Un promedio de 2 automóviles por minuto llegan a la salida de Elkhart de la autopista de Indiana. 
La distribución de llegadas se aproxima a una distribución de Poisson. 

a) ¿Cuál es la probabilidad de que ningún automóvil llegue en un minuto? 

b) ¿Cuál es la probabilidad de que por lo menos llegue un automóvil en un minuto? 

35. Se calcula que 0.5% de quienes se comunican al departamento de servicio al cliente de Dell, Inc., 
escuchará un tono de línea ocupada. ¿Cuál es la probabilidad de que de las 1 200 personas que 
se comunicaron hoy, por lo menos 5 hayan escuchado un tono de línea ocupada? 

36. En el pasado, las escuelas del Condado de Los Ángeles cerraron un promedio de tres días cada 
año por emergencias climáticas. ¿Cuál es la probabilidad de que las escuelas del Condado de Los 
Ángeles cierren cuatro días el próximo año? 


Resumen del capítulo 

I. Una variable aleatoria es un valor numérico determinado por el resultado de un experimento. 

II. Una distribución de probabilidad es una lista de posibles resultados de un experimento y la proba- 
bilidad asociada con cada resultado. 

A. Una distribución de probabilidad discreta sólo puede adoptar ciertos valores. Las principales 
características son: 

1. La suma de las probabilidades es 1.00. 

2. La probabilidad de un resultado se encuentra entre 0.00 y 1 .00. 

3. Los resultados son mutuamente excluyentes. 

B. Una distribución continua puede adoptar una infinidad de valores dentro de un rango específico. 

III. La media y la varianza de una distribución de probabilidad se calculan de la siguiente manera: 

A. La media es igual a: 

A = 2[xP(x)] (6-1) 

B. La varianza es igual a: 

a 2 = 2[(x - |i,) 2 P(x)] (6-2) 

IV. La distribución binomial posee las siguientes características: 

A. Cada resultado se clasifica en una de dos categorías mutuamente excluyentes. 

B. La distribución es resultado de la cuenta del número de éxitos en una cantidad fija de ensayos. 



Ejercicios del capítulo 
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C. 

D. 

E. 


F. 


G. 


V. La 

A. 

B. 

C. 

D. 

E. 


VI. La 

A. 

B. 

C. 

D. 

E. 


F. 


La probabilidad de un éxito es la misma de un ensayo al siguiente. 
Cada ensayo es independiente. 

Una probabilidad binomial se determina de la siguiente manera: 

P(x) = n C x TT*(1 - < * 

La media se calcula de la siguiente manera: 

(JL = Í1 TT 


La varianza es 


<r 2 = mr( 1 — i t) 


(6-3) 


(6-4) 


(6-5) 


distribución hipergeométrica posee las siguientes características: 

Sólo hay dos posibles resultados. 

La probabilidad de un éxito no es la misma en cada ensayo. 

La distribución es resultado de contar el número de éxitos en una cantidad fija de ensayos. 
Se le utiliza cuando se toman muestras sin reemplazo de una población finita. 

Una probabilidad hipergeométrica se calcula a partir de la siguiente ecuación: 


P(x) 


(sQx)(N-sCn-x) 

(nC„) 


( 6 - 6 ) 


distribución de Poisson posee las siguientes características: 

Describe el número de veces que se presenta un evento en un intervalo específico. 

La probabilidad de un “éxito” es proporcional a la longitud del intervalo. 

Los intervalos que no se superponen son independientes. 

Es una forma restrictiva de ia distribución binomial, en la que n es grande y tt pequeña. 
La probabilidad de Poisson se determina a partir de la siguiente ecuación: 


P(x) = ^ (6-7) 

La media y la varianza son: 

pt = n-iT (6-8) 

a 2 = rv ir 


comed 


Ejercicios del capítulo 

37. ¿Cuál es la diferencia entre una variable aleatoria y una distribución de probabilidad? 

38. En cada uno de los siguientes enunciados, indique si la variable aleatoria es discreta o continua. 

a) El tiempo de espera para un corte de cabello. 

b) El número de automóviles que rebasa un corredor cada mañana. 

c) El número de hits de un equipo femenil de softbol de preparatoria. 

d) El número de pacientes atendidos en el South Strand Medical Center entre las seis y diez de la 
noche, cada noche. 

e) La distancia que recorrió en su automóvil con el último tanque de gasolina. 

f) El número de clientes del Wendy’s de Oak Street que utilizaron las instalaciones. 

g) La distancia entre Gainesville, Florida, y todas las ciudades de Florida con una población de por 
lo menos 50 000 habitantes. 

39. Una inversión producirá $1 000 , $2 000 y $5 000 a fin de año. Las probabilidades de estos valo- 
res son de 0 . 25 , 0.60 y 0 . 15 , respectivamente. Determine ia media y la varianza del valor de la 
inversión. ^ ^ 

40. El gerente de personal de Cumberland Pig Iron Company estudia el número de accidentes labora- 
les en un mes y elaboró la siguiente distribución de probabilidad. Calcule la media, la varianza y la 
desviación estándar del número de accidentes en un mes. 
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Número de 
accidentes 

Probabilidad 

0 

.40 

1 

.20 

2 

.20 

3 

.10 

4 

.10 


41 . Croissant Bakery, Inc., ofrece pasteles con decorados especiales para cumpleaños, bodas y otras 
ocasiones. La pastelería también tiene pasteles normales. La siguiente tabla incluye el número 
total de pasteles vendidos al día, así como la probabilidad correspondiente. Calcule la media, la 
varlanza y la desviación estándar del número de pasteles vendidos al día. yT 


Número de pasteles 
vendidos en un día 

Probabilidad 

12 

.25 

13 

.40 

14 

.25 

15 

.10 


42 . Abajo se muestran los premios de la lotería Powerball y sus correspondientes pronósticos y pro- 
babilidades de ocurrencia. El precio del boleto es de un dólar. Encuentre la media y la desviación 
estándar del premio. Sugerencia: No olvide incluir el costo del boleto y su correspondiente proba- 
bilidad. 


Divisiones 

Premios 

Pronósticos 

Probabilidad 

Five plus Powerball 

$50 000 000 

146 107 962 

0.000000006844 

Match 5 

200 000 

3 563 609 

0.000000280614 

Four plus Powerball 

10 000 

584 432 

0.000001711060 

Match 4 

100 

14 255 

0.000070145903 

Three plus Powerball 

100 

11 927 

0.000083836351 

Match 3 

7 

291 

0.003424657534 

Two plus Powerball 

7 

745 

0.001340482574 

One plus Powerball 

4 

127 

0.007812500000 

Zero plus Powerball 

3 

69 

0.014285714286 


43 . En una reciente encuesta, 35% indicó que el chocolate era su sabor favorito de helado. Suponga 
que seleccionamos una muestra de diez personas y les preguntamos cuál es su sabor favorito de 
helado. 

a) ¿Cuántas personas de la muestra esperaría usted que mencionaran al chocolate? 
ib) ¿Cuál es la probabilidad de que exactamente cuatro personas incluidas en la muestra mencio- 
nen al chocolate? 

c) ¿Cuál es la probabilidad de que cuatro o más mencionen al chocolate? 

44 . Treinta por ciento de la población de una comunidad del suroeste de Estados Unidos es hispano- 
hablante. Se acusó a un hispanohablante de haber asesinado a un estadounidense que no habla- 
ba español. De los primeros 12 posibles jurados, sólo dos son estadounidenses hispanohablantes 
y 10 no lo son. El abogado de la defensa se opone a la elección del jurado, pues dice que habrá 
prejuicio contra su cliente. El fiscal no está de acuerdo y arguye que la probabilidad de esta com- 
posición del jurado es frecuente. Calcule la probabilidad y explique los supuestos. m 

45 . Un auditor de Health Maintenance Services of Georgia informa que 40% de los asegurados de 55 
años de edad y mayores utilizan la póliza durante el año. Se seleccionan al azar 15 asegurados de 
los registros de la compañía. 

a) ¿Cuántos asegurados cree que utilizaron la póliza el año pasado? 

b) ¿Cuál es la probabilidad de que diez de los asegurados seleccionados hayan utilizado la póli- 
za el año pasado? 

c) ¿Cuál es la probabilidad de que 10 o más de los asegurados seleccionados hayan utilizado la 
póliza el año pasado? 
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d) ¿Cuál es la probabilidad de que más de 10 de los asegurados seleccionados hayan utilizado la 
póliza el año pasado? 

46 . Tire and Auto Supply contempla hacer una división de 2 a 1 de las acciones. Antes de realizar la 
transacción, por lo menos dos terceras partes de los 1 200 accionistas de la compañía deben 
aprobar la oferta. Para evaluar la probabilidad de que la oferta se apruebe, el director de finanzas 
eligió una muestra de 18 accionistas. Contactó a cada uno y comprobó que 14 aprobaron la pro- 
puesta. ¿Cuál es la posibilidad de este evento, si dos terceras partes de los accionistas dan su 
aprobación? 

47 . Un estudio federal informó que 7.5% de la fuerza laboral de Estados Unidos tiene problemas con 
las drogas. Una oficial antidrogas del estado de Indiana decidió investigar esta afirmación. En una 
muestra de 20 trabajadores: 

a) ¿Cuántos cree que presenten problemas de adicción a las drogas? ¿Cuál es la desviación 
estándar? 

b) ¿Cuál es la probabilidad de que ninguno de los trabajadores de la muestra manifieste proble- 
mas de adicción? 

c) ¿Cuál es la probabilidad de que por lo menos uno de los trabajadores de la muestra presente 
problemas de adicción? 

48 . El Banco de Hawai informa que 7% de sus clientes con tarjeta de crédito dejará de pagar en algún 
momento. La sucursal de Hilo envió el día de hoy 12 nuevas tarjetas. 

a) ¿Cuántos de los nuevos tarjetahabientes cree que dejarán de pagar? ¿Cuál es la desviación 
estándar? 

b) ¿Cuál es la probabilidad de que ninguno de los tarjetahabientes deje de pagar? 

c) ¿Cuál es la probabilidad de que por lo menos uno deje de pagar? 

49 . Estadísticas recientes sugieren que 15% de los que visitan un sitio de ventas de menudeo en la 
web realiza la compra. Un minorista desea verificar esta afirmación. Para hacerlo, seleccionó una 
muestra de 16 “visitas” de su sitio y descubrió que 4 realizaron una compra. 

a) ¿Cuál es la probabilidad de que exactamente cuatro realicen una compra? 

b) ¿Cuántas compras deben esperarse? 

c) ¿Cuál es la probabilidad de que cuatro o más “visitas” terminen en compra? 

50 . En el capítulo 19 se estudia la muestra de aceptación. El muestreo de aceptación se utiliza para 
supervisar la calidad de la materia prima que entra. Suponga que un comprador de componentes 
electrónicos permite que 1 % de los componentes se encuentren defectuosos. Para garantizar la 
calidad de las partes que entran, por lo general se toman 20 partes como muestra y se permite 
una parte defectuosa. 

a) ¿Cuál es la probabilidad de aceptar un lote con 1 % de partes defectuosas? 

b) Si la calidad del lote que ingresa en realidad fue de 2%, ¿cuál es la probabilidad de que se 
acepte? 

c) Si la calidad del lote que ingresa en realidad fue de 5%, ¿cuál es la probabilidad de que se 
acepte? 

51 . Colgate-Palmolive, Inc., creó recientemente una nueva pasta dental con sabor a miel. Ésta fue pro- 
bada por un grupo de diez personas. Seis de ellas dijeron que les gustaba el nuevo sabor y las 
cuatro restantes indicaron que en definitiva no les agradaba. Cuatro de las diez se seleccionan 
para que participen en una entrevista a fondo. Entre quienes fueron elegidos para la entrevista, 
¿cuál es la probabilidad de que a dos les haya gustado el nuevo sabor, y a dos no? 

52 . La doctora Richmond, psicóloga, estudia el hábito de ver televisión durante el día de estudiantes 
de preparatoria. Ella cree que 45% de los estudiantes de preparatoria ve telenovelas por la tarde. 
Para investigar un poco más, elige una muestra de 10. 

a) Elabore una distribución de probabilidad del número de estudiantes de la muestra que ven tele- 
novelas. 

b) Determine la media y la desviación estándar de esta distribución. 

c) ¿Cuál es la probabilidad de encontrar que exactamente cuatro vean telenovelas? 

d) ¿Cuál es la probabilidad de que menos de la mitad de los estudiantes elegidos vean telenovelas? 

53 . Un estudio reciente llevado a cabo por Penn, Shone, and Borland para LastMinute.com reveló que 
52% de los viajeros de negocios planea sus viajes menos de dos semanas antes de partir. El estu- 
dio se va a repetir en un área que abarca tres estados con una muestra de 12 viajeros de nego- 
cios frecuentes. 

a) Elabore una distribución de probabilidad del número de viajeros que planean sus viajes a dos 
semanas de partir. 

b) Determine la media y la desviación estándar de esta distribución. 

c) ¿Cuál es la probabilidad de que exactamente 5 de los 12 agentes viajeros planeen sus viajes 
dos semanas antes de partir? 

d) ¿Cuál es la probabilidad de que 5 o más de los 12 agentes viajeros seleccionados planeen sus 
viajes dos semanas antes de partir? 
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54 . Suponga que Hacienda estudia la categoría de las contribuciones para la beneficencia. Se selec- 
cionó una muestra de 25 declaraciones de parejas jóvenes de entre 20 y 35 años de edad con un 
ingreso bruto de más de $100 000. De estas 25 declaraciones, cinco incluían contribuciones de 
beneficencia de más de $1 000. Suponga que cuatro de estas declaraciones se seleccionan para 
practicarles una auditoría completa. 

a) Explique por qué resulta adecuada la distribución hipergeométrica. 

Jb) ¿Cuál es la probabilidad de que exactamente una de las cuatro declaraciones auditadas tuvie- 
ran deducciones de beneficencia de más de $1 000? 
c) ¿Cuál es la probabilidad de que por lo menos una de las cuatro declaraciones auditadas tuvie- 
ran deducciones de beneficencia de más de $1 000? 

55 . El despacho de abogados Hagel and Hagel se localiza en el centro de Cincinnati. La empresa tiene 
10 socios; 7 viven en Ohio y 3 en el norte de Kentucky. La señora Wendy Hagel, la gerente, desea 
nombrar un comité de 3 socios que estudien la posibilidad de mudar el despacho al norte de 
Kentucky. Si el comité se selecciona al azar de entre los 1 0 socios, ¿cuál es la probabilidad de que: 

а) un miembro del comité viva en el norte de Kentucky y los otros en Ohio? 

б) por lo menos 1 miembro del comité viva en el norte de Kentucky? 

56 . Información reciente que publicó la Environmental Protection Agency indica que Honda es el fabri- 
cante de cuatro de los nueve vehículos más económicos en lo que se refiere al consumo de gaso- 
lina. 

a) Determine la distribución de probabilidad del número de autos Honda en una muestra de tres 
autos elegidos entre los nueve más económicos, 
ib) ¿Cuál es la posibilidad de que en la muestra de tres por lo menos haya un Honda? 

57 . El cargo de jefe de la policía en la ciudad de Corry, Pennsylvania, se encuentra vacante. Un comi- 
té de búsqueda, Integrado por los residentes de esa población tiene la responsabilidad de reco- 
mendar al alcalde de la ciudad el nuevo jefe de policía. Hay 12 candidatos, 4 de los cuales son 
mujeres o miembros de una minoría. El comité decide entrevistar a los 12 candidatos. Primero 
seleccionaron al azar a cuatro candidatos para entrevistarlos el primer día, ninguno de los cuales 
resultó ser mujer ni miembro de una minoría. El periódico local, Corry Press, en una de sus colum- 
nas editoriales, sugiere que hay discriminación. ¿Cuál es la probabilidad de que así sea? 

58. En la lista siguiente aparece la población por estado de los 1 5 con mayor población. Asimismo, se 
incluye información sobre el hecho de que un límite del estado está en el golfo de México, el 
Océano Atlántico o el Océano Pacífico (línea costera). m 


Rango 

Estado 

Población 

Línea costera 

1 

California 

36 553 215 

Sí 

2 

Texas 

23 904 380 

Sí 

3 

Nueva York 

19 297 729 

Sí 

4 

Florida 

18 251 243 

Sí 

5 

Illinois 

12 852 548 

No 

6 

Pennsylvania 

12 432 792 

No 

7 

Ohio 

11 466 917 

No 

8 

Michigan 

10 071 822 

No 

9 

Georgia 

9 544 750 

Sí 

10 

Carolina del Norte 

9 061 032 

Sí 

11 

Nueva Jersey 

8 685 920 

Sí 

12 

Virginia 

7 712 091 

Sí 

13 

Washington 

6 468 424 

Sí 

14 

Massachusetts 

6 449 755 

Sí 

15 

Indiana 

6 345 289 

No 


Observe que 5 de los 15 estados no tienen costa. Suponga que se seleccionan tres estados al 

azar. ¿Cuál es la probabilidad de que: 

a) ninguno de los estados seleccionados tenga costa? 

ib) exactamente un estado tenga costa? 

c) por lo menos un estado seleccionado tenga costa? 
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59. Las ventas de automóviles Lexus en la zona de Detroit se rigen por una distribución de Poisson 
con una media de 3 al día. 

a) ¿Cuál es la probabilidad de que ningún Lexus se venda determinado día? 

b) ¿Cuál es la probabilidad de que durante 5 días consecutivos se venda por lo menos un Lexus? 

60. Suponga que 1 .5% de las antenas de los nuevos teléfonos celulares Nokia tiene defectos. En una 
muestra aleatoria de 200 antenas, calcule las siguientes probabilidades: 

a) Ninguna de las antenas se encuentra defectuosa. 

£>) Tres o más antenas se encuentran defectuosas. 

61. Un estudio relacionado con las filas de las cajas registradoras en Safeway Supermarket, en el área 
de South Strand, reveló que entre las 4 y 7 de la tarde de los fines de semana hay un promedio de 
cuatro clientes en la fila de espera. ¿Cuál es la probabilidad de que al visitar Safeway en este hora- 
rio encuentre lo siguiente: 

a) ningún cliente en la fila? 

b) cuatro clientes en la fila de espera? 

c) cuatro o menos clientes en la fila? 

d) cuatro o más clientes en espera? 

62. Un estudio Interno llevado a cabo por el departamento de Servicios Tecnológicos de Lahey Elec- 
tronics reveló que los empleados de la compañía reciben un promedio de dos correos electróni- 
cos por hora. Suponga que la recepción de estos correos obedece aproximadamente a una dis- 
tribución de Poisson. 

a) ¿Cuál es la probabilidad de que Linda Lahey, presidenta de la compañía, haya recibido exac- 
tamente 1 correo entre las 4 y 5 de la tarde del día de ayer? 

b) ¿Cuál es la probabilidad de que haya recibido 5 o más correos durante ese horario? 

c) ¿Cuál es la probabilidad de que no haya recibido correos en ese horario? 

63. Los informes recientes relacionados con el crimen indican que cada minuto ocurren 3.1 robos de 
vehículos motorizados en Estados Unidos. Suponga que la distribución de los robos por minuto 
se puede aproximar por medio de una distribución de probabilidad de Poisson. 

a) Calcule la probabilidad de que ocurran exactamente cuatro robos en un minuto. 

b) ¿Cuál es la probabilidad de que no haya robos en un minuto? 

c) ¿Cuál es la probabilidad de que por lo menos haya un robo en un minuto? 

64. New Process, Inc., proveedor grande de venta por correo de ropa para dama, anuncia sus entre- 
gas de pedidos el mismo día. Desde hace poco, el movimiento de los pedidos no corresponde a 
los planes y se presentan muchas quejas. Bud Owens, director de servicio al cliente, rediseñó por 
completo el sistema de manejo de pedidos. Ei objetivo consiste en tener menos de cinco pedidos 
sin entregar al concluir 95% de los días hábiles. Las revisiones frecuentes de pedidos no entrega- 
dos al final del día revelan que la distribución de pedidos sin entregar se rige por una distribución 
de Poisson con una media de dos pedidos. 

a) ¿Alcanzó New Process, Inc., sus objetivos? Presente evidencias. 

b) Trace un histograma que represente la distribución de probabilidad de Poisson de pedidos sin 
entregar. 

65. La National Aeronautics and Space Administration (NASA) ha sufrido dos desastres. El Challenger 
estalló en el océano Atlántico en 1986 y el Columbia estalló al este de Texas en 2003. Ha habido 
un total de 1 13 misiones espaciales. Suponga que los errores se siguen presentando con la misma 
razón y considere las siguientes 23 misiones. ¿Cuál es la probabilidad de que se presenten exac- 
tamente dos fallas? ¿Cuál es la probabilidad de que no se presenten fallas? 

66. De acuerdo con la “teoría de enero”, si el mercado accionario sube durante ese mes, seguirá 
haciéndolo el resto del año. Si no sube, no lo hará el resto del año. De acuerdo con un artículo de 
The Wall Street Journal, esta teoría se mantuvo vigente 29 de los últimos 34 años. Suponga que 
la teoría es falsa; es decir, la probabilidad de que éste suba o baje es de 0.50. ¿Cuál es la proba- 
bilidad de que esto suceda por casualidad? (Es posible que requiera un paquete de software, 
como Excel o Minitab.) 

67. Durante la segunda ronda del torneo abierto de golf de 1 989 en Estados Unidos, cuatro jugadores 
registraron un hoyo en uno al jugar el sexto hoyo. Se calcula que la posibilidad de que un jugador 
profesional de golf registre un hoyo en uno es de 3 708 a 1 ; por lo tanto, la probabilidad es de 
1/3 709. Ese día participaron 155 jugadores de golf en la segunda ronda. Calcule la probabilidad 
de que cuatro jugadores de golf registren un hoyo en uno al jugar el sexto hoyo. 

68. Suponga que el National Hurricane Center pronostica que los huracanes azotarán la zona afecta- 
da con un 0.95 de probabilidad. Responda las siguientes preguntas. 

a) ¿De qué distribución de probabilidad se trata en este caso? 

b) ¿Cuál es la probabilidad de que 10 huracanes toquen tierra en la zona afectada? 

c) ¿Cuál es la probabilidad de que por lo menos 1 0 huracanes toquen tierra fuera de la zona afec- 
tada? 
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La tormenta continúa 
hacia el noroeste 
Posición: 27.8 N, 71.4 0 
Movimiento: NNO a 8 mph 
Vientos constantes: 105 mph 

Alas 11 de la noche del martes 

■■■ ■ Localización del huracán 
Localización de la tormenta 
tropical 



69 . Un estudio reciente de CBS News informó que 67% de los adultos cree que el Departamento del 
Tesoro de Estados Unidos debe seguir acuñando monedas de un centavo. 



Un centavo ahorrado es... 
para aquellos que 
46% siempre piden cambio 


18-29 


30-44 


45-64 


65 o mas 


Suponga que se selecciona una muestra de 15 adultos. 

a) ¿Cuántos de los 15 adultos indicarían que el Departamento del Tesoro debe seguir acuñando 
monedas de un centavo? ¿Cuál es la desviación estándar? 

b) ¿Cuál es la probabilidad de que exactamente 8 adultos indiquen que el Departamento del 
Tesoro debe seguir acuñando monedas de un centavo? 

c) ¿Cuál es la probabilidad de que por lo menos 8 adultos indiquen que el Departamento del 
Tesoro debe seguir acuñando monedas de un centavo? 


Ejercicios de lo base de datos 

70 . Consulte los datos de Real State, que reporta información de las casas vendidas en el área de 
Goodyear, Arizona, el último año. 

a) Construya una distribución de probabilidad del número de habitaciones. Calcule la media y la 
desviación estándar de la distribución. 

b) Construya la distribución de probabilidad del número de baños. Calcule la media y la desvia- 
ción estándar de la distribución. 

71 . Consulte los datos Baseball 2009. Calcule el número medio de jonrones por juego. Para hacerlo, 
encuentre primero el número medio de jonrones por juego para 2009. Después, divida este valor 
entre 162 (una temporada comprende 162 juegos). En seguida multiplique por 2, dado que hay dos 
equipos en cada juego. Utilice la distribución de Poisson para estimar el número de jonrones que 
se batearán en un juego. Encuentre la probabilidad de que: 

a) No haya jonrones en un juego. 

b) Haya dos jonrones en un juego. 

c) Haya cuando menos cuatro jonrones en un juego. 
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1. Los comandos de MegaStat para crear la distribución de 
probabilidad binomial de la página 199 son: 

a) Seleccione la opción Add-lns en la barra de herramien- 
tas. En el extremo izquierdo, seleccione el menú Mega- 


Stat. Haga clic en Probability y en Discrete Probability 
Distributions. Ingrese n, number of triáis y p, probabi- 
lity of occurrence, y haga clic en OK. 
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Cancel 
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b) En el cuadro de diálogo, seleccione Binomial; el núme- 
ro de ensayos es 6; la probabilidad de un éxito es de 

0. 05. Si desea ver una gráfica, haga clic en display 
graph. 

2. Los comandos de Excel para determinar la distribución de 
probabilidad binomial de la página 200 son: 

a) En una hoja de cálculo de Excel en blanco escriba la 
palabra Éxito en la celda Al , y la palabra Probabilidad en 
la celda B1 . De las celdas A2 a Al 7 escriba los números 
enteros 0 a 15. Active la celda 62 haciendo clic en ella. 

b) De la barra de herramientas seleccione Formulas y en el 
extremo izquierdo, seleccione Function fx. 

c) En el primer cuadro de diálogo seleccione Statistical en 
la categoría de funciones, y BINOMDIST en la categoría 
del nombre de la función; en seguida haga clic en OK. 

d) En el segundo cuadro de diálogo introduzca los cuatro 
elementos que se requieren para calcular una probabili- 
dad binomial. 

1. Introduzca 0 como el número de éxitos. 

2. Introduzca 40 como el número de ensayos. 

3. Introduzca 0.09 como probabilidad de un éxito. 

4. Introduzca la palabra false o el número 0 como proba- 
bilidades individuales y haga clic en OK. 


5. Excel calculará la probabilidad de 0 éxitos en 40 ensa- 
yos, con una probabilidad de 0.09 de éxito. El resulta- 
do, 0.02299618, se almacena en la celda B2. 

e) Para determinar por completo la distribución de proba- 
bilidad, en la barra de fórmulas sustituya el 0 ubicado a 
la derecha del paréntesis de apertura con A2. 

f) Arrastre el ratón a la esquina inferior izquierda de la 
celda B2 hasta que aparezca el símbolo + con líneas 
sólidas negras; en seguida haga clic, seleccione y resal- 
te la columna B, celda B17. Aparecerá la probabilidad 
de un éxito para los diversos valores de la variable alea- 
toria. 

3. Los comandos de Excel para determinar la distribución hi- 

pergeométrica de la página 206 son los siguientes: 

a) En una hoja de cálculo en blanco de Excel, escriba las 
palabras Miembros de un sindicato en la celda Al y la 
palabra Probabilidad en la celda B1 . En las celdas A2 a 
A7 escriba los enteros 0 a 5. Haga clic en B2 como celda 
activa. 

b) De la barra de herramientas elija Formulas y en el extre- 
mo izquierdo, Insert Function fx. 

c) En el primer cuadro de diálogo, seleccione Statistical y 
HYPERGEOMDIST, y haga clic en OK. 
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d) En el segundo cuadro de diálogo introduzca los cuatro 
elementos necesarios para calcular una probabilidad 
hipergeométrica. 

1. Introduzca 0 como número de éxitos. 

2. Introduzca 5 como número de ensayos. 

3. Introduzca 40 como número de éxitos en la población. 

4. Introduzca 50 como tamaño de la población y haga 
clic en OK. 

5. Excel calculará la probabilidad de 0 éxitos en 5 ensa- 
yos (0.000118937) y almacenará el resultado en la 
celda F9. 


e) Para determinar la distribución de probabilidad comple- 
ta, haga doble clic en la celda B2. Aparecerá la función 
hipergeométrica. Reemplace el 0 a la derecha del parén- 
tesis abierto con la referencia de la celda A2. 

f) Arrastre el ratón a la esquina inferior derecha de la celda 
F9 hasta que aparezca el símbolo + en líneas negras 
sólidas; en seguida haga clic, seleccione y resalte la 
columna F, celda F14. Aparecerá la probabilidad de un 
éxito para los diversos resultados. 



4. Los comandos de Minitab para generar la distribución de 

Poisson de la página 209 son los siguientes: 

a) En la columna C1 coloque el encabezado Éxitos, y en 
C2, Probabilidad. Introduzca los enteros 0 a 5 en la pri- 
mera columna. 

b) Seleccione Cale; en seguida Probability Distributions y 
Poisson. 

c) En el cuadro de diálogo, haga clic en Probability; igua- 
le la media a 0.3 y seleccione C1 como columna de 
entrada de datos. Designe C2 como memoria opcional y 
en seguida haga clic en OK. 
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Capítulo 6 


Respuestas a las autoevaluaciones 



6-1 


a) 


Número 

de puntos Probabilidad 


1 

2 

3 

4 

5 

6 


Total 


1 

6 

1 

6 

1_ 

6 

1_ 

6 

6 

6 

6 

-= -i.00 
6 


b) 



2 3 4 5 6 

Número de puntos 


c) |,0 1 . 

6-2 a) Discreta, pues los valores $0.80, $0.90 y $1 .20 se 

encuentran claramente separados entre sí. Asimismo, 
la suma de las probabilidades es 1 .00 y los resultados 
son mutuamente excluyentes. 


X 

P(x) 

xP(x) 

$ .80 

.30 

0.24 

.90 

.50 

0.45 

1.20 

.20 

0.24 



0.93 


La media es de 93 centavos. 


X 

P(x) 

(X - (J.) 

(x - fi) 2 P(x) 

$0.80 

.30 

-0.13 

.00507 

0.90 

.50 

-0.03 

.00045 

1.20 

.20 

0.27 

.01458 




.02010 


La varianza es de 0.02010, y la desviación estándar, 
de 14 centavos. 


6-3 a) Es razonable, porque a cada empleado se le hace un 
depósito directo o no se le hace; los empleados son 
independientes; la probabilidad de que se hagan 
depósitos directos es de 0.80 en el caso de todos, y 
se cuentan los empleados de 7 que se benefician del 
servicio. 

b) P(7) = 7 C 7 (.80) 7 (.20)° = .2097 

c) P(4) = 7 C 4 (.80) 4 (,20) 3 = .1147 

d) Las respuestas concuerdan. 

6-4 n = 4, tt = .60 

a) P(x = 2) = .346 

b) P(x < 2) = .526 

c) P(x > 2) = 1 - .526 = .474 


6-5 P( 3) = 


8 C 3 4 C 2 
12C5 

(56)(6) 


(—Y—) 

\3!5! / \2!2! / 


12 ! 

5!7! 


= .424 
792 

6-6 |jl — 4 000(.0002) = 0.8 
0.8V 0 ' 8 


P(1) = 


1 ! 


= .3595 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Distribuciones de 
probabilidad continua 


OA1 Enumerar las 
características de la 
distribución uniforme. 

OA2 Calcular probabilidades 
con la distribución uniforme. 

OA3 Enumerar las 
características de la 
distribución de probabilidad 
normal. 

OA4 Convertir una 
distribución normal en una 
distribución normal estándar. 

OA5 Encontrar la 
probabilidad de que una 
variable aleatoria 
normalmente distribuida se 
ubique entre dos valores. 

OA6 Encontrar las 
probabilidades por medio de 
la regla empírica. 

OA7 Aproximar la 
distribución binomlal 
mediante la distribución 
normal. 

OA8 Describir las 
características y calcular las 
probabilidades mediante la 
distribución exponencial. 



Ochenta por ciento de las habitaciones de los cruceros de la línea 
Royal Viking se encuentra ocupado durante septiembre. En el caso de 
un crucero con 800 habitaciones, ¿cuál es la probabilidad de que 665 
o más habitaciones se encuentren ocupadas ese mes? (Vea ejercicio 
60, objetivo 7.) 



7.2 La familia de distribuciones de probabilidad uniforme 
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7.1 Introducción 

En el capítulo 6 se inició el estudio de las tres distribuciones de probabilidad discreta: bino- 
mial, hipergeométrica y de Poisson. Estas distribuciones se basan en variables aleatorias dis- 
cretas, que sólo adoptan valores claramente separados. Por ejemplo, si elige para estudiar 10 
pequeñas empresas que iniciaron sus operaciones en 2000, la cantidad de empresas que 
todavía funcionan en 2011 puede ser de 0, 1,2, ..., 10. No puede haber 3.7, 12 o —7 que lo 
hagan. Entonces, sólo son posibles determinados resultados, los cuales se encuentran repre- 
sentados por valores claramente separados. Además, el resultado se determina al contar el 
número de éxitos. Hay que contar el número de empresas que aún funcionan en 2011. 

En este capítulo seguimos con el estudio de las distribuciones de probabilidad, pero ahora 
de las continuas. Una distribución de probabilidad continua resulta de medir algo, como la dis- 
tancia del dormitorio al salón de clases, el peso de un individuo o la cantidad de bonos que 
ganan los directores ejecutivos. Suponga que seleccionamos a cinco estudiantes y calcula- 
mos que las distancias, en millas, que viajan a clases son de 12.2, 8.9, 6.7, 3.6 y 14.6. Cuando 
examinamos una distribución continua, la información que nos interesa es el porcentaje de 
estudiantes que viajan menos de 10 millas o el porcentaje que viaja más de 8 millas. En otras 
palabras, en el caso de una distribución continua, quizá desee conocer el porcentaje de obser- 
vaciones que se presentan dentro de cierto margen. Es importante señalar que una variable 
aleatoria continua tiene un número infinito de valores dentro de cierto intervalo particular. Así, 
debe pensar en la probabilidad de que una variable tenga un valor dentro de un intervalo deter- 
minado, en vez de pensar en la probabilidad de un valor específico. 

Consideraremos tres familias de distribuciones: la distribución de probabilidad unifor- 
me, la de probabilidad normal y la de probabilidad exponencial. 


7.2 La familia de distribuciones 
de probabilidad uniforme 

La distribución de probabilidad uniforme es, tal vez, la distribución más simple de una varia- 
ble aleatoria continua. La distribución tiene forma rectangular y queda definida por valores 
mínimos y máximos. He aquí algunos ejemplos que se rigen por una distribución uniforme. 


• El tiempo de vuelo de una aerolínea comercial de Orlando, Florida, 
a Atlanta, Georgia, varía de 60 a 120 minutos. La variable aleatoria 
es el tiempo de vuelo dentro de este intervalo. Observe que la varia- 
ble de interés, el tiempo de vuelo en minutos, es continua en el inter- 
valo de 60 a 120 minutos. 

• Los voluntarios de la Grand Strand Public Library elaboran formas 
para declaraciones de impuestos federales. El tiempo que tar- 
dan para confeccionar una forma 1040-EZ se rige por una distribu- 
ción uniforme en el intervalo de 10 a 30 minutos. La variable aleato- 
ria es la cantidad de minutos que emplean para llenar la forma, que 
puede asumir cualquier valor entre 1 0 y 30. 

En la gráfica 7-1 aparece una distribución uniforme. La forma de la distribución es rectangular 
y posee un valor mínimo a y un máximo b. Observe, asimismo, que la altura de la distribución 
es constante o uniforme para todos los valores entre ay b. 
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OA1 Enumerar las 
características de la 
distribución uniforme. 


El área total bajo la curva 
siempre 1. 



La media de una distribución uniforme se localiza a la mitad del intervalo entre los valores 
mínimo y máximo. Se calcula de la siguiente manera: 


MEDIA DE LA DISTRIBUCIÓN UNIFORME 


P = 


a + b 
2 


(7-1) 


y 


La desviación estándar describe la dispersión de una distribución. En la distribución unifor- 
me, la desviación estándar también se relaciona con el intervalo entre los valores máximo y 
mínimo. 


DESVIACIÓN ESTÁNDAR DE LA 
DISTRIBUCIÓN UNIFORME 


(b - af 


12 




(7-2) 




La ecuación de la distribución de probabilidad uniforme es: 


DISTRIBUCIÓN UNIFORME P(x) 



sia<x<byOen cualquier otro lugar 


(7-3) 


y 


Como se demostró en el capítulo 6, las distribuciones de probabilidad sirven para hacer 
afirmaciones relativas a los valores de una variable aleatoria. En el caso de distribuciones que 
describen una variable aleatoria continua, las áreas dentro de la distribución representan pro- 
babilidades. En el caso de la distribución uniforme, su forma rectangular permite aplicar la 
fórmula del área de un rectángulo. Recuerde que el área de un rectángulo se determina al mul- 
tiplicar la longitud por la altura. En el caso de la distribución uniforme, la altura del rectángulo 
es P(x), que es 1 /(b-a). La longitud de la base de la distribución esb-a. Observe que, si mul- 
tiplicamos la altura de la distribución por todo su intervalo para determinar el área, el resulta- 
es do siempre es 1 .00. En otras palabras, el área total dentro de una distribución de probabilidad 
continua es igual a 1 .00. En general: 


Área = (altura)(base) = — . (b - a) = 1 .00 

(o — a) 

De este modo, si una distribución uniforme va de 10 a 15, la altura es de 0.20, que se deter- 
mina mediante 1/(15 — 10). La base es de 5, que se calcula al restar 15-10. El área total es: 

Área = (altura)(base) = 777 777- (1 5 — 1 0) = 1 .00 

(15 — 10 ) 

Un ejemplo ¡lustrará las características de una distribución uniforme y la forma de calcular pro- 
babilidades por medio de ella. 
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Cjemplo 


Solución 


OA2 Calcular 
probabilidades con la 
distribución uniforme. 


La Southwest Arizona State University proporciona servicio de transporte de autobús a los 
estudiantes mientras se encuentran en el recinto. Un autobús llega a la parada de North Main 
Street y College Drive cada 30 minutos, entre las 6 de la mañana y las 1 1 de la noche entre 
semana. Los estudiantes llegan a la parada en tiempos aleatorios. El tiempo que espera un 
estudiante tiene una distribución uniforme de 0 a 30 minutos. 


1 . 

2 . 

3. 


4. 

5. 


Trace una gráfica de la distribución. 

Demuestre que el área de esta distribución uniforme es de 1 .00. 

¿Cuánto tiempo esperará el autobús “normalmente” un estudiante? En otras palabras, 
¿cuál es la media del tiempo de espera? ¿Cuál es la desviación estándar de los tiempos 
de espera? 

¿Cuál es la probabilidad de que un estudiante espere más de 25 minutos? 

¿Cuál es la probabilidad de que un estudiante espere entre 10 y 20 minutos? 


En este caso, la variable aleatoria es el tiempo que espera un estudiante. El tiempo se mide en 
una escala continua, y los minutos de espera varían de 0 a 30. 

1. La gráfica 7-2 muestra la distribución uniforme. La línea horizontal se traza a una altura 
de 0.0333, que se calcula mediante 1/(30 - 0). El intervalo de esta distribución es de 30 
minutos. 


.060 


= .0333 



10 20 30 40 

Tiempo de espera (minutos) 

GRÁFICA 7-2 Distribución de probabilidad uniforme de tiempos de espera de los estudiantes 

2. El tiempo que los estudiantes esperan el autobús es uniforme a lo largo del intervalo de 0 
a 30 minutos; así, en este caso, a es 0 y ó 30. 

Área = (altura)(base) = — — (30 - 0) = 1 .00 

3. Para determinar la media, aplique la fórmula (7-1): 

a + b 0 + 30 


P = 


= 15 


La media de la distribución es de 15 minutos; así, el tiempo de espera habitual del servi- 
cio de autobús es de 15 minutos. 

Para determinar la desviación estándar de los tiempos de espera, aplique la fórmu- 
la (7-2): 


(b - a) 2 


12 


(30 - 0) 2 


12 


= 8.66 


La desviación estándar de la distribución es de 8.66 minutos. Es la variación de los tiem- 
pos de espera de los estudiantes. 

4. El área dentro de la distribución en el intervalo de 25 a 30 representa esta probabilidad en 
particular. De acuerdo con la fórmula del área: 

P( 25 < tiempo de espera < 30) = (altura)(base) = inr y - — — (5) = .1667 
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Así, la probabilidad de que un estudiante espere entre 25 y 30 minutos es 0.1667. Tal con- 
clusión se ilustra en la siguiente gráfica: 

P(x) 

.0333 - 


Area = .1667 


0 


10 p = 15 20 



5. El área dentro de la distribución en el intervalo de 10 a 20 representa la probabilidad. 

P(10 < tiempo de espera < 20)(altura)(base) = (10) = .3333 

(30 0) 

Esta probabilidad se ilustra de la siguiente manera: 

P(x) 

.0333 - 


Area = .3333 



10 n = 15 20 


30 



Los perros ovejeros australianos tienen una vida relativamente corta, pues su duración obedece a 
una distribución uniforme de entre 8 y 14 años. 

a) Trace la distribución uniforme. ¿Cuáles son los valores de la altura y de la base? 

b ) Demuestre que el área total bajo la curva es de 1 .00. 

c) Calcule la media y la desviación estándar de esta distribución. 

d) ¿Cuál es la probabilidad de que un perro en particular viva entre 10 y 14 años? 

e) ¿Cuál es la probabilidad de que un perro viva menos de 9 años? 


comed: 


Ejercicios 

1. Una distribución uniforme se define en el intervalo de 6 a 10. 

a) ¿Cuáles son los valores de a y de 6? 

b ) ¿Cuál es la media de esta distribución uniforme? 

c) ¿Cuál es la desviación estándar? 

d) Demuestre que el área total es de 1 .00. 

e) Calcule la probabilidad de un valor mayor que 7. 

f) Calcule la probabilidad de un valor entre 7 y 9. 

2. Una distribución uniforme se define en el intervalo de 2 a 5. 

a) ¿Cuáles son los valores de a y 6? 

b ) ¿Cuál es la media de esta distribución uniforme? 

c) ¿Cuál es la desviación estándar? 

d) Demuestre que el área total es de 1 .00. 

e) Calcule la probabilidad de un valor mayor que 2.6. 

f) Calcule la probabilidad de un valor entre 2.9 y 3.7. 

3. El precio de cierre de una acción común de Schnur Sporting Goods Inc., está uniformemente dis- 
tribuido entre $20 y $30 por acción. ¿Cuál es la probabilidad de que el precio de la acción sea: 

a) mayor a $27? 

b ) menor o igual a $24? 


7.3 La familia de distribuciones de probabilidad normal 
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OA3 Enumerar las caracte- 
rísticas de la distribución de 
probabilidad normal. 


4. De acuerdo con el Insurance Institute of America, una familia de cuatro miembros gasta entre $400 
y $3 800 anuales en toda clase de seguros. Suponga que el dinero que se gasta tiene una distri- 
bución uniforme entre estas cantidades. 

a) ¿Cuál es la media de la suma que se gasta en seguros? 

b) ¿Cuál es la desviación estándar de la suma que se gasta? 

c) Si elige una familia al azar, ¿cuál es la probabilidad de que gaste menos de $2 000 anuales en 
seguros? 

d ) ¿Cuál es la probabilidad de que una familia gaste más de $3 000 anuales? 

5. Las precipitaciones de abril en Flagstaff, Arizona, tienen una distribución uniforme de entre 0.5 y 
3.00 pulgadas. 

a) ¿Cuáles son los valores de a y ó? 

b) ¿Cuál es la precipitación media del mes? ¿Cuál es la desviación estándar? 

c) ¿Cuál es la probabilidad de que haya menos de 1 pulgada de precipitación en el mes? 

d) ¿Cuál es la probabilidad de que haya exactamente 1 pulgada de precipitación en el mes? 

e) ¿Cuál es la probabilidad de que haya más de 1 .5 pulgadas de precipitación en el mes? 

6. Los clientes con problemas técnicos en su conexión de internet pueden llamar a un número 01- 
800 para solicitar asistencia técnica. El técnico tarda entre 30 segundos y 10 minutos para resol- 
ver el problema. La distribución de este tiempo de asistencia tiene una distribución uniforme. 

a) ¿Cuáles son los valores de a y ó en minutos? 

b) ¿Cuál es el tiempo medio que se requiere para resolver el problema? ¿Cuál es la desviación 
estándar del tiempo? 

c) ¿Qué porcentaje de los problemas consumen más de 5 minutos para ser resueltos? 

d) Suponga que intenta determinar 50% de los tiempos de resolución de los problemas. ¿Cuáles 
son los puntos extremos de estos dos tiempos? 

7.3 La familia de distribuciones 
de probabilidad normal 

A continuación se estudia la distribución de probabilidad normal. A diferencia de la distribu- 
ción uniforme [vea la fórmula (7-3)], la distribución de probabilidad normal tiene una fórmula 
muy compleja. 


DISTRIBUCIÓN DE PROBABILIDAD NORMAL 


P(x) 



(X - M-) 2 ! 
2a 2 J 


(7-4) 


V 


Sin embargo, no se preocupe por la complejidad de esta fórmula. Usted ya conoce varios de 
estos valores. Los símbolos |x y a son la media y la desviación estándar. La letra griega ir es 
una constante matemática natural, cuyo valor es aproximadamente 22/7 o 3.1416. La letra e 
también es una constante matemática. Es la base del sistema de logaritmos naturales y es 
Igual a 2.718; y X es el valor de una variable aleatoria continua. Así, una distribución normal se 
basa —se define— en su media y su desviación estándar. 

No necesitará hacer cálculos con la fórmula (7-4). Más bien, requerirá una tabla, la cual 
aparece en el apéndice B.1, para buscar las diversas probabilidades. 

La distribución de probabilidad normal posee las siguientes características principales. 

• Tiene forma de campana y posee una sola cima en el centro de la distribución. La media 
aritmética, la mediana y la moda son ¡guales, y se localizan en el centro de la distribución. 
El área total bajo la curva es de 1 .00. La mitad del área bajo la curva normal se localiza a 
la derecha de este punto central, y la otra mitad, a la Izquierda. 

• Es simétrica respecto de la media. Si hace un corte vertical, por el valor central, a la curva 
normal, las dos mitades son imágenes especulares. 

• Desciende suavemente en ambas direcciones del valor central. Es decir, la distribución es 
asintótica. La curva se aproxima más y más al eje X, sin tocarlo. En otras palabras, las 
colas de la curva se extienden indefinidamente en ambas direcciones. 

• La localización de una distribución normal se determina a través de la media, p,. La dis- 
persión o propagación de la distribución se determina por medio de la desviación están- 
dar, <T. 

Estas características se muestran en la gráfica 7-3. 
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GRAFICA 7-3 Características de una distribución normal 

No sólo existe una distribución de probabilidad normal, sino una familia. Por ejemplo, en 
la gráfica 7-4 se comparan las distribuciones de probabilidad del tiempo de servicio de los 
empleados de tres diferentes plantas. En la planta de Camden, la media es de 20 años, y la 
desviación estándar, de 3.1 años. Existe otra distribución de probabilidad normal del tiempo 
de servicio en la planta de Dunkirk, donde pe = 20 años y a = 3.9 años. En la planta de Elmira, 
pe = 20 años y a = 5.0 años. Observe que las medias son las mismas, pero las desviaciones 
estándar difieren. 


Medias iguales, desviaciones 
estándares diferentes. 


0 4 7 10 13 16 19 22 25 28 31 34 37 40 
p = 20 años de servicio 



GRÁFICA 7-4 


Distribución de probabilidad normal con medias iguales y desviaciones estándar 
diferentes 


La gráfica 7-5 muestra la distribución de los pesos de las cajas de tres cereales. Los pesos 
tienen una distribución normal con diferentes medias e idéntica desviación o estándar. 


Medias diferentes, desviación 
estándar igual. 



GRAFICA 7-5 Distribución de probabilidad normal con diferentes medias y desviación 


estándar igual 


7.4 Distribución de probabilidad normal estándar 


229 


Por último, la gráfica 7-6 muestra tres distribuciones normales con diferente media y des- 
viación estándar. Éstas muestran la distribución de fuerzas de tensión, medidas en libras por 
pulgada cuadrada (psi), de tres clases de cables. 


Medias diferentes, desviación 
estándar diferente. 



|i P |! 

2 000 2 107 2 186 

psi psi psi 


GRAFICA 7-6 Distribuciones de probabilidad normal con medias y desviación estándar diferente 

Recuerde que, en el capítulo 6, las distribuciones de probabilidad discreta muestran las 
posibilidades específicas de que ocurra un valor discreto. Por ejemplo, en la página 196, 
mediante la distribución binomial se calcula la probabilidad de que ninguno de los cinco vue- 
los que llegan al Aeropuerto Regional Bradford de Pennsylvania esté retrasado. 

En el caso de la distribución de probabilidad continua, las áreas bajo la curva definen pro- 
babilidades. El área total bajo la curva normal es de 1 .0. Esto explica todos los posibles resul- 
tados. Como una distribución de probabilidad normal es simétrica, el área bajo la curva a la 
izquierda de la media es de 0.5, y el área bajo la curva a la derecha de la media, de 0.5. Aplique 
esta regla a la distribución de Sugar Yummies en la gráfica 7-5. Es una distribución normal con 
una media de 283 gramos. Por consiguiente, la probabilidad de llenar una caja con más de 
283 gramos es de 0.5, y la probabilidad de llenar una caja con menos de 283 gramos, de 0.5. 
También puede determinar la probabilidad de que una caja pese entre 280 y 286 gramos. Sin 
embargo, para determinar esta probabilidad necesita conocer la distribución de probabilidad 
normal estándar. 


Hay sólo una distribución 
normal estándar. Tiene una 
media de 0 y una desviación 
estándar de 1 . 


7.4 Distribución de probabilidad normal estándar 

El número de distribuciones normales es ilimitado, y cada una posee diferentes media (p), des- 
viación estándar (o-), o ambas. Mientras que es posible proporcionar tablas de probabilidad de 
distribuciones discretas, como la binomial y la de Poisson, es imposible elaborar tablas de una 
infinidad de distribuciones normales. Por fortuna, un miembro de la familia se utiliza para 
determinar las probabilidades de todas las distribuciones de probabilidad normal. Es la distri- 
bución de probabilidad normal estándar y es única, pues tiene una media de 0 y una des- 
viación estándar de 1 . 

Cualquier distribución de probabilidad normal puede convertirse en una distribución de 
probabilidad normal estándar si se resta la media de cada observación y se divide esta dife- 
rencia entre la desviación estándar. Los resultados reciben el nombre de valores z o valores 
tipificados. 


VALOR z Distancia con signo entre un valor seleccionado, designado X, y la media, p, 
dividida entre la desviación estándar, a. 


De esta manera, el valor z es la distancia de la media, medida en unidades de desviación 
estándar. 

En términos de una fórmula, 

OA4 Convertir una 
distribución normal en una 
distribución normal estándar. 


VALOR NORMAL ESTANDAR 


z = 


X - p 


(7-5) 
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CAPÍTULO 7 Distribuciones de probabilidad continua 



Estadística en acción 

Las aptitudes de un indi- 
viduo dependen de una 
combinación de factores 
hereditarios y ambienta- 
les, cada uno de los cua- 
les tiene más o menos la 
misma influencia. Por 
consiguiente, como en el 
caso de una distribución 
binomial con un gran 
número de pruebas, 
muchas habilidades y 
aptitudes tienen una dis- 
tribución normal. Por 
ejemplo, las calificacio- 
nes en el Scholastic 
Aptitude Test (SAT) tie- 
nen una distribución nor- 
mal con una media de 
1 000 y una desviación 
estándar de 140. 



OA5 Encontrar la 
probabilidad de que una 
variable aleatoria 
normalmente distribuida se 
ubique entre dos valores. 


En donde: 

X es el valor de cualquier observación y medición. 

|jl es la media de la distribución, 
a es la desviación estándar de la distribución. 

Según se observa en la definición anterior, un valorz expresa la distancia o diferencia entre 
un valor particular de X y la media aritmética en unidades de desviación estándar. Una vez que 
se estandarizan las observaciones de la distribución normal, los valores z se distribuyen nor- 
malmente con una media de 0 y una desviación estándar de 1. Así, la distribución z posee 
todas las características de cualquier distribución de probabilidad normal. Estas característi- 
cas aparecen en la lista de la página 227. La tabla del apéndice B.1 (también incluida en la 
parte interior de la pasta trasera) contiene una lista de las probabilidades de la distribución de 
probabilidad normal estándar. A continuación, una pequeña parte de esta tabla. 


TABLA 7-1 Areas bajo la curva normal 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 


1.3 

0.4032 

0.4049 

0.4066 

0.4082 

0.4099 

0.4115 


1.4 

0.4192 

0.4207 

0.4222 

0.4236 

0.4251 

0.4265 


1.5 

0.4332 

0.4345 

0.4357 

0.4370 

0.4382 

0.4394 


1.6 

0.4452 

0.4463 

0.4474 

0.4484 

0.4495 

0.4505 


1.7 

0.4554 

0.4564 

0.4573 

0.4582 

0.4591 

0.4599 


1.8 

0.4641 

0.4649 

0.4656 

0.4664 

0.4671 

0.4678 


1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 



Para explicarlo, suponga que desea calcular la probabilidad de que las cajas de Sugar 
Yummies pesen entre 283 y 285.4 gramos. De acuerdo con la gráfica 7-5, el peso de la caja 
de Sugar Yummies tiene una distribución normal con una media de 283 gramos y una desvia- 
ción estándar de 1 .6 gramos. Ahora quiere conocer la probabilidad o área bajo la curva entre 
la media, 283 gramos, y 285.4 gramos. También se expresa este problema con notación de la 
probabilidad, similar al estilo que se utilizó en el capítulo anterior: P(283 < peso < 285.4). Para 
determinar la probabilidad, es necesario convertir tanto 283 gramos como 285.4 gramos en 
valores z con la fórmula (7-5). El valorz correspondiente a 283 es 0, que se calcula mediante 
la operación (283 - 283)/1 .6. El valorz correspondiente a 285.4 es 1 .50, que se calcula median- 
te la operación (285.4 - 283)/1.6. Después, consulte la tabla del apéndice B.1. Una parte se 
reproduce en la tabla 7-1 . Descienda por la columna de la tabla que encabeza la letra z hasta 
1 .5. Ahora siga por la horizontal a la derecha y lea la probabilidad bajo la columna que comien- 
za con 0.00. Ésta es de 0.4332. Esto significa que el área bajo la curva entre 0.00 y 1 .50 es de 
0.4332. Tal es la probabilidad de que una caja seleccionada al azar de Sugar Yummies pese 
entre 283 y 285.4 gramos, lo cual se ilustra en la siguiente gráfica. 
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Aplicaciones de la distribución normal estándar 

¿Cuál es el área bajo la curva entre la media y X en la tabla 7-2?, ¿el caso de los valores z? 
Verifique sus respuestas comparándolas con las que se dan. Necesitará el apéndice B.1 o la 
tabla que se encuentra en la parte interior de la pasta trasera de este libro. 


TABLA 7-2 Áreas de valores z seleccionados 


Valores z calculados 

Área 

2.84 

.4977 

1.00 

.3413 

0.49 

.1879 


Ahora se calcula el valor z dada la media poblacional, pu, la desviación estándar de la 
población, o-, y unaX elegida. 




Los ingresos semanales de los supervisores de turno de la industria del vidrio se rigen por una 
distribución de probabilidad normal con una media de $1 000 y una desviación estándar de 
$1 00. ¿Cuál es el valor z del ingreso X de un supervisor que percibe $1 1 00 semanales? ¿Y de 
un supervisor que gana $900 semanales? 


De acuerdo con la fórmula (7-5), los valores z de los dos valores X ($1 100 y $900) son: 
Para X = $1 100: Para X = $900: 



CT 



(T 


$1 100 - $1 000 
$100 


$900 - $1 000 
$100 


= 1.00 


= - 1.00 


El valor z de 1.00 indica que un ingreso semanal de $1 100 está a una desviación están- 
dar por encima de la media, y un valor z de -1.00 muestra que un ingreso de $900 está a una 
desviación estándar por debajo de la media. Observe que ambos ingresos ($1 1 00 y $900) se 
encuentran a la misma distancia ($100) de la media. 



; \ 

De acuerdo con la información del ejemplo anterior (p = $1 000 y cr = $100), convierta: 

a) El ingreso semanal de $1 225 en un valor z. 

b) El ingreso semanal de $775 en un valor z. 


Regla empírica 


OA6 Encontrar las probabi- 
lidades por medio de la regla 
empírica. 


Antes de analizar más aplicaciones de la distribución de probabilidad normal estándar, se con- 
sideran tres áreas bajo la curva normal que se emplearán en los siguientes capítulos. Estos 
hechos recibieron el nombre de regla empírica en el capítulo 3 (vea la p. 86). 

1 . Cerca de 68% del área bajo la curva normal se encuentra a una desviación estándar de la 
media, lo que se puede escribir como p ± la. 

2. Alrededor de 95% del área bajo la curva normal se encuentra a dos desviaciones están- 
dares de la media. Esto se puede escribir como p ± 2a. 

3. Prácticamente toda el área bajo la curva se encuentra a tres desviaciones estándares de 
la media, lo cual se escribe p ± 3a. 
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CAPÍTULO 7 Distribuciones de probabilidad continua 


Cjemplo 


Solución 


Esta información se resume en la siguiente gráfica. 



-3-2-10 1 2 3 


Escala de X 

Escala de z 


La transformación de medidas en desviaciones normales estándares modifica la escala. 
Las conversiones también se muestran en la gráfica. Por ejemplo, p + lo- se convierte en un 
valor z de 1.00. Asimismo, p - 2 ct se transforma en un valor z de —2.00. Note que el centro 
de la distribución z es cero, lo cual indica que no hay desviación de la media, p. 


Como parte de su programa de control de calidad, la compañía Autolite Battery realiza prue- 
bas acerca de la vida útil de las baterías. La vida media de una batería de celda alcalina D es 

de 19 horas. La vida útil de la batería se rige por una distribución normal con una desviación 

estándar de 1 .2 horas. Responda las siguientes preguntas: 

1 . ¿Entre qué par de valores se localiza 68% de las baterías? 

2. ¿Entre qué par de valores se localiza 95% de las baterías? 

3. ¿Entre qué par de valores se localiza prácticamente la totalidad de las baterías? 

Aplique los resultados de la regla empírica para responder estas preguntas. 

1. Alrededor de 68% de las baterías tiene una vida útil de entre 17.8 y 20.2 horas, lo cual se 
determina con el cálculo 19.0 ± 1(1.2) horas. 

2. Cerca de 95% de las baterías tiene una vida útil de entre 16.6 y 21.4 horas, lo cual se 
determina mediante 19.0 ± 2(1.2) horas. 

3. De hecho, todas las baterías tienen una vida útil de entre 15.4 y 22.6 horas, lo cual se 
determina por medio de 19.0 ± 3(1.2) horas. 

Esta información se resume en la siguiente gráfica. 


/ 




0070 


95% 

Prácticamente todas 

^*>1 - 

p - 3o p - 2o p - 1 o p p + 1 o p + 2o p + 3o Escala 

15.4 16.6 17.8 19.0 20.2 21.4 22.6 en horas 
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La distribución de los ingresos anuales de un grupo de empleados de mandos medios en Compton 
Plastics se aproxima a una distribución normal, con una media de $47 200 y una desviación están- 
dar de $800. 

a) ¿Entre qué par de valores se encuentran aproximadamente 68% de los ingresos? 

b) ¿Entre qué par de valores se encuentran aproximadamente 95% de los ingresos? 

c) ¿Entre qué par de valores se encuentran casi todos los ingresos? 

d) ¿Cuáles son los ingresos medio y modal? 

e) ¿La distribución de ingresos es simétrica? 


comed 


Ejercicios 

7. Explique el significado del siguiente enunciado: “No existe sólo una distribución de probabilidad 
normal, sino una ‘familia’”. 

8. Enumere las características más importantes de una distribución de probabilidad normal. 

9. La media de una distribución de probabilidad normal es de 500; la desviación estándar es de 10. 

a) ¿Entre qué par de valores se localiza alrededor de 68% de las observaciones? 

b) ¿Entre qué par de valores se localiza alrededor de 95% de las observaciones? 

c) ¿Entre qué par de valores se localiza casi la totalidad de las observaciones? 

10. La media de una distribución de probabilidad normal es de 60; la desviación estándar es de 5. 

a) ¿Alrededor de qué porcentaje de las observaciones se encuentra entre 55 y 65? 

b) ¿Cerca de qué porcentaje de las observaciones se encuentra entre 50 y 70? 

c) ¿Alrededor de qué porcentaje de las observaciones se encuentra entre 45 y 75? 

11. La familia Kamp tiene gemelos, Rob y Rachel. Ambos se graduaron de la universidad hace dos 
años y actualmente cada uno gana $50 000 anuales. Rachel trabaja en la industria de las ventas 
de menudeo, donde el salario medio de ejecutivos con menos de cinco años de experiencia es de 
$35 000, con una desviación estándar de $8 000. Rob es ingeniero. El salario medio de los inge- 
nieros con menos de cinco años de experiencia es de $60 000, con una desviación estándar de 
$5 000. Calcule los valores z de Rob y de Rachel, y comente los resultados. 

12. Un artículo reciente que apareció en el Cincinnati Enquirer informó que el costo medio de la mano 
de obra para reparar una bomba de calefacción es de $90, con una desviación estándar de $22. 
Monte’s Plumbing and Heating Service terminó la reparación de dos bombas de calefacción por 
la mañana. El costo de la mano de obra de la primera bomba fue de $75, y de la segunda, de $1 00. 
Calcule los valores z de cada caso y comente sobre sus resultados. 


Determinación de áreas bajo 
la curva normal 

La siguiente aplicación de la distribución normal estándar se relaciona con la determinación 
del área en una distribución normal entre la media y un valor elegido, que se identifica con X. 
El siguiente ejemplo ilustra los detalles. 



En el ejemplo anterior (vea la p. 231), el ingreso medio semanal de un supervisor de turno de 
la industria del vidrio tiene una distribución normal, con una media de $1 000 y una desviación 
estándar de $100. Es decir, |x = $1 000 y o- = $100. ¿Cuál es la probabilidad de seleccionar a 
un supervisor cuyo ingreso semanal oscile entre $1 000 y $1 100? Esta pregunta se expresa 
con notación de probabilidad de la siguiente manera: P($1 000 < ingreso semanal < $1 100). 

Ya sabe que $1 100 tiene un valor z de 1.00 mediante la fórmula (7-5). Para repetir, 

X - p, _ $1 100 - $1 000 


z = 


$100 


= 1.00 
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CAPÍTULO 7 Distribuciones de probabilidad continua 


La probabilidad asociada con un valor z de 1.00 se encuentra disponible en el apéndice B.1, 
una parte del cual se presenta a continuación. Para localizar la probabilidad, descienda por la 
columna izquierda hasta 1.0 y en seguida vaya a la columna con el encabezado 0.00. El valor 
es 0.3413. 



El área bajo la curva normal entre $1 000 y $1 100 es de 0.3413. También puede decir que 
34.13% de los supervisores de turno en la industria del vidrio gana entre $1 000 y $1 100 se- 
manales, o que la probabilidad de seleccionar a un supervisor cuyo ingreso oscile entre $1 000 
y$1 100 es de 0.3413. 

Esta información se resume en el siguiente diagrama. 





En el ejemplo anterior interesaba la probabilidad entre la media y un valor dado. 
Cambiemos la pregunta. En lugar de querer conocer la probabilidad de seleccionar al azar a 
un supervisor que gane entre $1 000 y $1 100, suponga que quiere determinar la probabilidad 
de seleccionar a un supervisor que gane menos de $1 100. En notación probabilística, este 
enunciado se escribe como P(ingreso semanal < $1 100). El método de solución es el mismo. 
Determine la probabilidad de seleccionar a un supervisor que gane entre $1 000, la media y 
$1 100. Esta probabilidad es 0.3413. En seguida, recuerde que la mitad del área, o probabili- 
dad, se encuentra sobre la media, y la otra mitad, debajo de ella. En consecuencia, la proba- 
bilidad de seleccionar a un supervisor que gane menos de $1 000 es de 0.5000. Por último, 
sume las dos probabilidades, de modo que 0.3413 + 0.5000 = 0.8413. Alrededor de 84% de 
los supervisores de la industria del vidrio gana menos de $1 100 mensuales (vea el siguiente 
diagrama). 
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Estadística en acción 

Muchos procesos, como 
llenar botellas de refresco 
y empacar fruta, tienen 
una distribución normal. 
Los fabricantes tienen 
que protegerse del llena- 
do excesivo, así como del 
llenado incompleto. Si 
ponen demasiado en la 
lata o en la botella, rega- 
lan el producto. Si ponen 
muy poco, el cliente se 
puede sentir engañado y 
el gobierno puede cues- 
tionar la descripción que 
aparece en la etiqueta. A 
menudo se utilizan gráfi- 
cas de control , con los 
límites trazados en tres 
desviaciones estándares 
por arriba y por debajo 
de la inedia, para supervi- 
sar esta clase de procesos 
de producción. 




Excel calculará esta probabilidad. Los comandos que se requieren se encuentran en la 
sección Comandos de software, al final del capítulo. La respuesta es 0.8413, la misma que 
se calculó. 



r 

Cjemplo 

Consulte la información relacionada con el ingreso semanal de los supervisores de turno en la 
industria del vidrio. La distribución de los ingresos semanales tiene una distribución de proba- 


bilidad normal, con una media de $1 000 y una desviación estándar de $100. ¿Cuál es la pro- 
babilidad de seleccionar a un supervisor de turno de la industria del vidrio cuyo ingreso: 


1 . oscile entre $790 y $1 000? 

2. sea menor que $790? 

Solución 

Comience por localizar el valor z correspondiente a un ingreso semanal de $790. De acuerdo 
con la fórmula 7-5: 


X — |x $790 - $1 000 
s ~~ $100 


Vea el apéndice B.l. Siga hacia abajo por el margen izquierdo hasta la fila 2.1 y a lo largo de 
dicha fila, hasta la columna con el encabezado 0.00. El valor es de 0.4821. Así, el área bajo la 
curva normal estándar correspondiente a un valor z de 2.10 es de 0.4821. Sin embargo, como 
la distribución normal es simétrica, el área entre 0 y un valor negativo dez es la misma que el 
área entre 0 y el correspondiente valor positivo dez. La probabilidad de localizar a un supervi- 
sor que gane entre $790 y $1 000 es de 0.4821. En notación probabilística: P($790 < ingreso 
semanal < $1 000) = 0.4821. 
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CAPÍTULO 7 Distribuciones de probabilidad continua 



La media divide la curva normal en dos mitades idénticas. El área bajo la mitad izquierda 
de la media es de 0.5000, y el área a la derecha también es de 0.5000. Como el área bajo la 
curva entre $790 y $1 000 es 0.4821, el área debajo de $790 es 0.0179, que se determina al 
restar 0.5000 - 0.4821. En notación probabilística: P(ingreso semanal < $790) = 0.0179. 

Esto significa que 48.21 % de los supervisores tiene ingresos semanales que oscilan entre 
$790 y $1 000. Además, es previsible que 1 .79% gane menos de $790 a la semana. Esta infor- 
mación se resume en el siguiente diagrama. 







\ 

jM 


.4821 

.5000 

.0179 

\ 

\ ^ 

\ 

i 

N 


-2.10 0 Escala de z 

$790 $1 000 Escala en dólares 





La temperatura dei café que vende Coffee Bean Cafe sigue una distribución de probabilidad normal, 
con una media de 150 grados. La desviación estándar de esta distribución es de 5 grados. 

a) ¿Cuál es la probabilidad de que la temperatura del café esté entre los 150 y los 154 grados? 

b) ¿Cuál es la probabilidad de que la temperatura del café sea de más de 164 grados? 


comect 


Ejercicios 

13. Una población normal tiene una media de 20.0 y una desviación estándar de 4.0. 

a) Calcule el valor de z asociado con 25.0. 

b) ¿Qué proporción de la población se encuentra entre 20.0 y 25.0? 

c) ¿Qué proporción de la población es menor que 18.0? 

14. Una población normal tiene una media de 12.2 y una desviación estándar de 2.5. 

a) Calcule el valor de z asociado con 14.3. 

b ) ¿Qué proporción de la población se encuentra entre 12.2 y 14.3? 

c) ¿Qué proporción de la población es menor que 10.0? 
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15. Un estudio reciente con respecto a salarios por hora de integrantes de equipos de mantenimien- 
to de las aerolíneas más importantes demostró que el salario medio por hora era de $20.50, con 
una desviación estándar de $3.50. Suponga que la distribución de los salarios por hora es una dis- 
tribución de probabilidad normal. Si elige un integrante de un equipo al azar, ¿cuál es la probabi- 
lidad de que gane: 

a) entre $20.50 y $24.00 la hora? 

b) más de $24.00 la hora? 

c) menos de $19.00 la hora? 

16. La media de una distribución de probabilidad normal es de 400 libras. La desviación estándar es 
de 10 libras. 

a) ¿Cuál es el área entre 415 libras y la media de 400 libras? 

b) ¿Cuál es el área entre la media y 395 libras? 

c) ¿Cuál es la probabilidad de seleccionar un valor al azar y descubrir que es menor que 395 
libras? 

Otra aplicación de la distribución normal se relaciona con la combinación de dos áreas 
o probabilidades. Una de las áreas se encuentra a la derecha de la media y la otra a la Iz- 
quierda. 



Recuerde la distribución de ingresos semanales de los supervisores de turno de la industria del 
vidrio. Los ingresos semanales tienen una distribución de probabilidad normal, con una media 
de $1 000 y una desviación estándar de $100. ¿Cuál es el área bajo esta curva normal, entre 
$840 y $1 200? 

El problema se puede dividir en dos partes. En el caso del área entre $840 y la media de $1 000: 

$840 - $1 000 -$160 

$100 ” $100 

En el del área entre la media de $1 000 y $1 200: 

$1 200 - $1 000 $200 

z ~~ $100 “ $100 ~~ 

El área bajo la curva de un valor z de -1.60 es 0.4452 (apéndice B.1). El área bajo la curva de 
un valorz de 2.00 es 0.4772. Si suma las dos áreas: 0.4452 + 0.4772 = 0.9224. Por consiguien- 
te, la probabilidad de elegir un ingreso entre $840 y $1 200 es de 0.9224. En notación probabi- 
lística: P($840 < ingreso semanal < $1 200) = 0.4452 + 0.4772 = 0.9224. Para resumir, 92.24% 
de los supervisores tiene un ingreso semanal de entre $840 y $1 200. Eso se muestra en el 
siguiente diagrama: 



Otra aplicación de la distribución normal se relaciona con determinar el área entre valores 
del mismo lado de la media. 
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CAPÍTULO 7 Distribuciones de probabilidad continua 


[ Cjemplo 


Solución 


De regreso a la distribución del ingreso semanal de los supervisores de turno de la industria del 
vidrio (ja = $1 000, a = $100), ¿cuál es el área bajo la curva normal entre $1 150 y $1 250? 


De nuevo, el caso se divide en dos partes, por lo que se aplica la fórmula (7-5). Primero halle 
el valor z relacionado con un salario semanal de $1 250: 


$1 250 | $1 000 
$100 


2.50 


En seguida determine el valor z de un salario semanal de $1 150: 


$1 150 - $1 000 „ _ 

$100 ' 5 

De acuerdo con el apéndice B.1, el área relacionada con un valor z de 2.50 es de 0.4938. 
Así, la probabilidad de un salario semanal entre $1 000 y $1 250 es de 0.4938. De manera simi- 
lar, el área asociada con un valor z de 1 .50 es 0.4332; de este modo, la probabilidad de un sala- 
rio semanal entre $1 000 y $1 150 es de 0.4332. La probabilidad de un salario semanal entre 
$1 150 y $1 250 se calcula al restar el área asociada con un valor z de 1.50 (0.4332) de la pro- 
babilidad asociada con un valor z de 2.50 (0.4938). Por consiguiente, la probabilidad de un 
salario semanal entre $1 150 y $1 250 es de 0.0606. En notación probabilística: P($1 150 < 
ingreso semanal < $1 250) = .4938 - .4332 = .0606. 



En síntesis, hay cuatro situaciones relacionadas con la determinación del área bajo la 

curva de la distribución de probabilidad normal estándar. 

1 . Para determinar el área entre 0 y z (o -z), se busca la probabilidad directamente en la tabla. 

2. Para determinar el área más allá de z (o -z), se localiza la probabilidad de z en la tabla y 
se resta dicha probabilidad de 0.5000. 

3. Para determinar el área entre dos puntos que se localizan en diferentes lados de la media, 
se determinan los valores z y se suman las probabilidades correspondientes. 

4. Para determinar el área entre dos puntos que se localizan en el mismo lado de la media, 
se determinan los valores z y se resta la probabilidad menor de la mayor. 



Refiérase a la autoevaluación 7-4. La temperatura del café que se vende en el Coffee Bean Café 
sigue una distribución de probabilidad normal, con una media de 150 grados. La desviación están- 
dar de esta distribución es 5 grados. 

a) ¿Cuál es la probabilidad de que la temperatura del café esté entre 146 y 156 grados? 

b) ¿Cuál es la probabilidad de que la temperatura del café sea de más de 156 pero menos de 162 
grados? 
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oomect 


Cjemplo 


Ejercicios 

17. Una distribución normal tiene una media de 50 y una desviación estándar de 4. 

a) Calcule la probabilidad de un valor localizado entre 44.0 y 55.0. 

b) Calcule la probabilidad de un valor mayor que 55.0. 

c) Calcule la probabilidad de un valor localizado entre 52.0 y 55.0. 

18. Una población normal tiene una media de 80.0 y una desviación estándar de 14.0. 

a) Calcule la probabilidad de un valor localizado entre 75.0 y 90.0. 

b) Calcule la probabilidad de un valor de 75.0 o menor. 

c) Calcule la probabilidad de un valor localizado entre 55.0 y 70.0. 

19. De acuerdo con el Internal Revenue Service (IRS) el reembolso medio de impuestos en 2007 fue 
de $2 708. Suponga que la desviación estándar es de $650 y que las sumas devueltas tienen una 
distribución normal. 

a) ¿Qué porcentajes de reembolsos son superiores a $3 000? 

b) ¿Qué porcentajes de reembolsos son superiores a $3 000 e inferiores a $3 500? 

c) ¿Qué porcentajes de reembolsos son superiores a $2 500 e inferiores a $3 500? 

20. El número de espectadores de American Idol tiene una media de 29 millones, con una desviación 
estándar de 5 millones. Asuma que esta distribución sigue una distribución normal. ¿Cuál es la 
probabilidad de que el programa de la próxima semana: 

a) tenga entre 30 y 34 millones de espectadores? 

b) tenga cuando menos 23 millones de espectadores? 

c) sobrepase los 40 millones de espectadores? 

21. WNAE, estación de AM dedicada a la transmisión de noticias, encuentra que la distribución del 
tiempo que los radioescuchas sintonizan la estación tiene una distribución normal. La media de la 
distribución es de 15.0 minutos, y la desviación estándar, de 3.5. ¿Cuál es la probabilidad de que 
un radioescucha sintonice la estación: 

a) más de 20 minutos? 

b) 20 minutos o menos? 

c) entre 10 y 12 minutos? 

22. Entre las ciudades de Estados Unidos con una población de más de 250 000 habitantes, la media 
del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más largo pertenece a 
la ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribución 
de los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal 
y la desviación estándar es de 7.5 minutos. 

a) ¿Qué porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos? 

b) ¿Qué porcentaje de viajes consumen entre 30 y 35 minutos? 

c) ¿Qué porcentaje de viajes consumen entre 30 y 40 minutos? 

En los ejemplos anteriores se requiere determinar el porcentaje de observaciones que se 
localiza entre dos observaciones, o el porcentaje de observaciones por encima o por debajo de 
una observación X. Otra aplicación de la distribución normal se relaciona con el cálculo del valor 
de la observación X, cuando se tiene el porcentaje por encima o por debajo de la observación. 



Layton Tire and Rubber Company pretende establecer una 
garantía de millaje mínimo para su nuevo neumático MX100. 
Algunas pruebas revelan que el millaje medio es de 67 900 
con una desviación estándar de 2 050, y que la distribución 
de millas tiene una distribución de probabilidad normal. 
Layton desea determinar el millaje mínimo garantizado de 
manera que no haya que sustituir más de 4% de los neu- 
máticos. ¿Qué millaje mínimo debe garantizar Layton? 


El siguiente diagrama muestra las facetas del caso, en el 
queX representa el millaje mínimo garantizado. 


Solución 
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Al sustituir estos valores en la fórmula (7-5), se obtiene: 

X - (jl X - 67 900 
Z “ a ~ 2 050 



Observe que hay dos incógnitas, z y X. Para determinar X, primero calcule z, y después des- 
peje X. Observe que el área que se encuentra por debajo de la curva normal a la Izquierda de 
(jl es de 0.5000. El área entre ^ y X es de 0.4600 y se determina al restar 0.5000 - 0.0400. En 
seguida consulte el apéndice B.l. Busque en la tabla el área más próxima a 0.4600. El área 
más cercana es 0.4599. Siga por los márgenes de este valor y lea el valor z de 1.75. Como el 
valor se encuentra a la izquierda de la media, en realidad es de -1 .75. Estos pasos se ilustran 
en la tabla 7-3. 

TABLA 7-3 Áreas seleccionadas debajo de la curva normal 


z ... 

.03 

.04 

.05 

.06 

1.5 

.4370 

.4382 

.4394 

.4406 

1.6 

.4484 

.4495 

.4505 

.4515 

1.7 

.4582 

.4591 

.4599 | 

.4608 

1.8 

.4664 

.4671 

.4678 

.4686 


A partir de que sabe que la distancia entre jr y X es de -1 .75 cr, o z = -1 .75, puede despe- 
jar X (millaje mínimo garantizado): 

_ X - 67 900 
Z ~~ 2 050 

_ X - 67 900 
“ 175 = 2 050 

-1.75(2 050) =X - 67 900 

X = 67 900 - 1.75(2 050) = 64 312 

Por consiguiente, Layton puede anunciar que reemplazará de forma gratuita cualquier neumá- 
tico que se desgaste antes de llegar a las 64 312 millas, y la empresa sabrá que sólo 4 % de los 
neumáticos se sustituirá de acuerdo con este plan. 


Excel también puede encontrar el valor del millaje. Vea la siguiente captura de pantalla. Los 
comandos necesarios se dan en la sección Comandos de software, al final del capítulo. 
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Un análisis de las calificaciones del examen final de introducción a la administración revela que tie- 
nen una distribución normal. La media de la distribución es de 75, y la desviación estándar, de 8. El 
profesor quiere recompensar con una A a los estudiantes cuyas calificaciones se encuentren dentro 
del 10% más alto. ¿Cuál es el punto de división de los estudiantes que merecen una A y los que 
merecen una B? 


comed 


Ejercicios 

23. Una distribución normal tiene una media de 50 y una desviación estándar de 4. Determine el valor 
por debajo del cual se presentará 95% de las observaciones. 

24. Una distribución normal tiene una media de 80 y una desviación estándar de 1 4. Determine el valor 
por encima del cual se presentará 80% de las observaciones. 

25. Suponga que el costo medio por hora de operación de un avión comercial se rige por una distri- 
bución normal, con una media de $2 100 y una desviación estándar de $250. ¿Cuál es el costo de 
operación más bajo de 3% de los aviones? 

26. La Prueba de Razonamiento SAT (antes conocida como la Prueba de Aptitudes Escolares) es qui- 
zás la prueba más amplia y la que más se utiliza para la admisión en las universidades de Estados 
Unidos. Las puntuaciones se basan en una distribución normal, con una media de 1 500 y una des- 
viación estándar de 300. Clinton College desearía ofrecer una beca honorífica a aquellos estudian- 
tes que obtengan puntuaciones que los coloquen en el 10% más alto. ¿Cuál es la puntuación míni- 
ma que se requiere para obtener la beca? 

27. De acuerdo con una investigación de medios de comunicación, el estadounidense común escu- 
chó 195 horas de música durante el año pasado. Este nivel se encuentra por debajo de las 290 
horas de hace cuatro años. Dick Trythall es un gran aficionado de la música country y del oeste. 
Escucha música mientras trabaja en casa, lee y maneja su camión. Suponga que la cantidad de 
horas que escucha música tiene una distribución de probabilidad normal, con una desviación 
estándar de 8.5 horas. 

a) Si Dick se encuentra por encima de 1% en lo que se refiere al tiempo que escucha música, 
¿cuántas horas al año escucha música? 

b) Suponga que la distribución de tiempos de hace cuatro años también tiene una distribución 
de probabilidad normal, con una desviación estándar de 8.5 horas. ¿Cuántas horas en reali- 
dad escucha música 1 % de los que menos lo hacen? 

28. Según los datos más recientes disponibles, el costo medio anual para asistir a una universidad pri- 
vada en Estados Unidos era de $26 889. Suponga que la distribución de los costos anuales se 
rigen por una distribución de probabilidad normal y que la desviación estándar es de $4 500. 
Noventa y cinco por ciento de los estudiantes de universidades privadas paga menos de ¿qué 
cantidad? 

29. En teoría económica, una “tasa mínima de retorno” es, como su nombre lo indica, el retorno míni- 
mo que una persona necesita antes de hacer una inversión. Una investigación revela que los retor- 
nos anuales de una clase especial de acciones comunes se distribuye de acuerdo con una distri- 
bución normal, con una media de 12% y una desviación estándar de 18%. Un corredor de bolsa 
desearía identificar una tasa mínima de retorno que esté por encima de ese valor en sólo 1 de 20 
acciones. ¿En cuánto debería establecer la tasa mínima de retorno? 
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OA7 Aproximar la 
distribución binomial 
mediante la distribución 
normal. 


Cuándo utilizar la aproxima- 
ción normal. 


30. El fabricante de una impresora láser informa que la cantidad media de páginas que imprime un 
cartucho antes de que deba ser reemplazado es de 12 200. La distribución de páginas impresas 
por cartucho se aproxima a la distribución de probabilidad normal, y la desviación estándar es de 
820 páginas. El fabricante desea proporcionar lineamientos a los posibles clientes sobre el tiem- 
po que deben esperar que les dure un cartucho. ¿Cuántas páginas debe indicar el fabricante por 
cartucho si desea tener 99% de certeza en todo momento? 

7.5 Aproximación de la distribución 
normal a la binomial 

En el capítulo 6 se describe la distribución de probabilidad binomial, que es una distribución 
discreta. La tabla de probabilidades binomiales del apéndice B.9 corre en sucesión de una n 
de 1 a una n de 15. Si un problema implicaba una muestra de 60, generar una distribución 
binomial de una cantidad tan grande habría consumido demasiado tiempo. Un enfoque más 
eficiente consiste en aplicar la aproximación de la distribución normal a la binomial. 

Parece razonable emplear la distribución normal (una distribución continua) en sustitución 
de la distribución binomial (una distribución discreta) en el caso de valores grandes de n, pues, 
conforme n se incrementa, una distribución binomial se aproxima cada vez más a una distri- 
bución normal. La gráfica 7-7 describe el cambio de forma de una distribución binomial con 
ir = 0.50, de una n de 1 , a una n de 3, a una n de 20. Observe cómo el caso en el que n = 20 
aproxima la forma de la distribución normal. En otras palabras, compare el caso en el que n = 
20 con la curva normal de la gráfica 7-3 de la página 228. 



n 

= 1 

n 

= 3 


.50 







.40 



.40 


.20 


.30 



.30 


.15 


.20 
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que se presenta 
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Número de veces que se 
presenta el evento 


GRÁFICA 7-7 Distribución binomial de una n de 1, 3 y 20, donde 


ir = 0.50 


¿Cuándo utilizar la aproximación normal? La distribución de probabilidad normal consti- 
tuye una buena aproximación de la distribución de probabilidad binomial cuando hit y n(1 - tt) 
son 5 por lo menos. Sin embargo, antes de aplicar la aproximación normal, debe estar segu- 
ro de que la distribución de interés es en verdad una distribución binomial. De acuerdo con el 
capítulo 6, se deben satisfacer cuatro criterios: 

1. Sólo existen dos resultados mutuamente excluyentes en un experimento: éxito o fracaso. 

2. La distribución resulta del conteo del número de éxitos en una cantidad fija de pruebas. 

3. La probabilidad de un éxito, ir, es la misma de una prueba a otra. 

4. Cada prueba es independiente. 

Factor de corrección de continuidad 

Para mostrar la aplicación de la aproximación de la distribución normal a la binomial, así como 
la necesidad de un factor de corrección, suponga que la administración de Santoni Pizza 
Restaurant se da cuenta de que 70% de sus nuevos clientes regresa a comer. ¿Cuál es la pro- 
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babilidad de que 60% o más clientes regresen a comer durante una semana en la que 80 nue- 
vos (primera vez) clientes comieron en Santoni? 

Observe que se cumplen las condiciones relacionadas con la distribución binomial: 1) sólo 
hay dos posibles resultados: un cliente regresa para consumir alimentos o no lo hace; 2) es 
posible contar el número de éxitos, lo cual significa, por ejemplo, que 57 de los 80 clientes 
regresan; 3) las pruebas son independientes, lo cual significa que si la persona número 34 
regresa a comer por segunda vez, esto no influye en el hecho de que la persona 58 vuelva; 
4) la probabilidad de que un cliente vuelva se mantiene en 0.70 para los 80 clientes. 

Por consiguiente, es aplicable la fórmula binomial (6-3), descrita en la página 196. 

P(x) = n C x «(1 - Ta- 
para determinar la probabilidad de que 60 o más clientes regresen para consumir pizza, 
primero necesita calcular la probabilidad de que regresen exactamente 60 clientes. Es decir: 

P(x = 60) = 80 C 60 (.7 O) 60 (1 - .70) 20 = .063 

En seguida determine la probabilidad de que exactamente 61 clientes regresen. Es decir: 

P(x = 61) = 80 C 61 (,70) 61 (1 - .70) 19 = .048 

Continúe con el proceso hasta obtener la probabilidad de que regresen los 80 clientes. Por últi- 
mo, sume las probabilidades de 60 a 80. Resulta engorroso resolver este problema con este 
procedimiento. También se puede utilizar un paquete de software de computadora, como 
Minitab o Excel, para determinar las diversas probabilidades. A continuación aparece una lista 
de las probabilidades binomiales para n = 80 y tt = 0.70, y x, el número de clientes que regre- 
san, que oscila de 43 a 68. La probabilidad de que regrese cualquier cantidad de clientes infe- 
rior a 43 o superior a 68 es menor que 0.001. También es posible suponer que estas probabi- 
lidades son iguales a 0.000. 


Número 
de clientes 
que regresan 

Probabilidad 

43 

.001 

44 

.002 

45 

.003 

46 

.006 

47 

.009 

48 

.015 

49 

.023 

50 

.033 

51 

.045 

52 

.059 

53 

.072 

54 

.084 

55 

.093 


Número 
de clientes 
que regresan 

Probabilidad 

56 

.097 

57 

.095 

58 

.088 

59 

.077 

60 

.063 

61 

.048 

62 

.034 

63 

.023 

64 

.014 

65 

.008 

66 

.004 

67 

.002 

68 

.001 


Se determina la probabilidad de que 60 o más clientes regresen al sumar 0.063 + 0.048 
+ ■ ■ ■ + 0.001 , que equivale a 0.197. Sin embargo, un vistazo a la gráfica de la página siguien- 
te muestra la similitud de esta distribución con una distribución normal. Todo lo que necesita 
es “arreglar” las probabilidades discretas para obtener una distribución continua. Además, tra- 
bajar con una distribución normal implicará unos cuantos cálculos más que hacerlo con la 
binomial. 

El truco consiste en permitir que la probabilidad discreta de 56 clientes quede represen- 
tada por un área bajo la curva continua entre 55.5 y 56.5; después, permitir que la probabili- 
dad de los 57 clientes quede representada por un área entre 56.5 y 57.5, etc. Este enfoque es 
exactamente contrario al de redondear las cifras a un número entero. 
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Estadística en acción 

Muchas variables tienen 
una distribución normal 
aproximada, como las 
calificaciones del cocien- 
te intelectual, las expecta- 
tivas de vida y la estatura 
en la edad adulta. Esto 
implica que casi todas las 
observaciones ocurrirán 
dentro de 3 desviaciones 
estándares respecto de la 
media. Por otra parte, son 
poco frecuentes las obser- 
vaciones que ocurren más 
allá de 3 desviaciones 
estándares respecto de la 
media. Por ejemplo, la 
estatura media de un 
adulto de sexo masculino 
es de 68.2 pulgadas (casi 
5 pies con 8 pulgadas), 
con una desviación están- 
dar de 2.74. Esto significa 
que casi todos los hom- 
bres miden entre 60.0 
pulgadas (5 pies) y 76.4 
pulgadas (6 pies, 4 pulga- 
das) de estatura. 

Shaquille O’Neal, juga- 
dor de basquetbol profe- 
sional de los Phoenix 
Suns, mide 86 pulgadas, 
o 7 pies con 2 pulgadas, 
lo cual rebasa las 3 des- 
viaciones estándares res- 
pecto de la media. La 
altura convencional de 
una puerta es de 6 pies 
con 8 pulgadas, y debe 
ser lo bastante alta para 
la mayoría de los hom- 
bres adultos, con excep- 
ción de una persona poco 
común, como Shaquille 
O’Neal. 

Otro ejemplo consiste 
en el hecho de que el 
asiento del conductor de 
la mayoría de los vehícu- 
los se encuentra colocado 
de manera que una per- 
sona que mida por lo 
menos 159 cm (62.5 pul- 
gadas de estatura) se sien- 
te con comodidad. La 

( continúa ) 



43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 

Clientes 


Como la distribución normal sirve para determinar la probabilidad binomial de 60 o más 
éxitos, debe restar, en este caso, 0.5 de 60. El valor de 0.5 recibe el nombre de factor de 
corrección de continuidad. Debe hacerse este pequeño ajuste porque una distribución con- 
tinua (la distribución normal) se utiliza para aproximar una distribución discreta (la distribución 
binomial). Al restar se obtiene 60 - 0.5 = 59.5. 


FACTOR DE CORRECCIÓN DE CONTINUIDAD Valor de 0.5 restado o sumado, según se requiera, a 
un valor seleccionado cuando una distribución de probabilidad discreta se aproxima por 
medio de una distribución de probabilidad continua. 


Cómo aplicar el factor de corrección 

Dicho factor se aplica en los siguientes cuatro casos: 

1. Para la probabilidad de que porlo menos ocurraX, se utiliza el área por encima de (X - 0.5). 

2. Para la probabilidad de que ocurra más que X, se utiliza el área por encima de ( X 4- 0.5). 

3. Para la probabilidad de que ocurra X o menos, se utiliza el área debajo de (X + 0.5). 

4. Para la probabilidad de que ocurra menos que X, se utiliza el área debajo de (X - 0.5). 

Para utilizar la distribución normal con el fin de aproximar la probabilidad de que regresen 
60 o más clientes de los 80 que van a Santoni por primera vez, se sigue el siguiente procedi- 
miento. 


Paso 1: Se determina el valor z correspondiente a una X de 59.5 con la fórmula (7-5), y las 
fórmulas (6-4) y (6-5), de la media y la varianza de una distribución binomial: 


(x = n tt = 80(.70) = 56 
o 2 = m r(1 - tt) = 80(.70)(1 - .70) = 16.8 
o- = Via8 = 4.10 


z 


X - |x 

CT 


59.5 - 56 
4.10 


0.85 


Paso 2: Determine al área bajo la curva normal entre una |x de 56 y unaX de 59.5. Según 
el paso 1, el valor z correspondiente a 59.5 es de 0.85. En seguida consulte el 
apéndice B.1, vaya hacia abajo del margen izquierdo hasta 0.8 y luego, en línea 
horizontal, hasta la columna con el encabezado 0.05. El área es de 0.3023. 
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distribución de estaturas 
de mujeres adultas es más 
o menos una distribución 
normal con una media de 
161.5 y una desviación 
estándar de 6.3 cm. Por 
consiguiente, alrededor 
de 35% de las mujeres 
adultas no se sienta 
cómodamente en el 
asiento del conductor. 



Paso 3: Calcule el área más allá de 59.5, para restar 0.3023 de 0.5000 (0.5000 - 0.3023 
= 0.1977). Por consiguiente, 0.1977 es la probabilidad de que regresen para con- 
sumir alimentos 60 o más clientes de los 80 que acuden por primera vez a 
Santoni. En notación probabilística: P(clientes > 59.5) = 0.5000 - 0.3023 = 
0.1977. Las facetas de este problema se muestran en la siguiente gráfica: 



Sin duda, usted estará de acuerdo en que utilizar la aproximación normal de la binomial 
constituye un método más eficaz para calcular la probabilidad de que regresen 60 o más clien- 
tes que acuden por primera vez. El resultado es comparable con el que se obtuvo en la pági- 
na 243, donde se utilizó la distribución binomial. La probabilidad, al utilizar la distribución blno- 
mial, es de 0.197, mientras que con la aproximación normal es de 0.1977. 



Autoevaluación 7-7 


Un estudio de la compañía Great Southern Home Insurance reveló que en 80% de los robos que se 
reportaron, los bienes no fueron recuperados por los dueños. 

a) Durante un periodo en el que ocurrieron 200 robos, ¿cuál es la probabilidad de que los bienes 
robados no se recuperen en 170 o más casos? 

b) Durante un periodo en el que ocurrieron 200 robos, ¿cuál es la probabilidad de que no se recu- 
peren los bienes robados en 150 o más casos? 


comed: 


Ejercicios 

31. Suponga una distribución de probabilidad binomial con n = 50 y -ir = 0.25. Calcule lo siguiente: 

a) La media y la desviación estándar de la variable aleatoria. 

b) La probabilidad de que X sea 15 o mayor. 

c) La probabilidad de que X sea 10 o menor. 

32. Suponga una distribución de probabilidad binomial con n = 40 y -ir = 0.55. Calcule lo siguiente: 

a) La media y la desviación estándar de la variable aleatoria. 

b) La probabilidad de que X sea 25 o mayor. 

c) La probabilidad de que X sea 15 o menor. 

d) La probabilidad de que X se encuentre entre 15 y 25 inclusive. 

33. Dottie’s Tax Service se especializa en declaraciones del impuesto sobre la renta de clientes profe- 
sionales, como médicos, dentistas, contadores y abogados. Una auditoría reciente de las decla- 
raciones que elaboraba la empresa, que llevó a cabo el Internal Revenue Service, IRS, indicó que 
7% de las declaraciones que había elaborado durante el año pasado contenía errores. Si esta tasa 
de error continúa este año y Dottie’s elabora 80 declaraciones, ¿cuál es la probabilidad de que 
cometa errores en: 

a) más de seis declaraciones? 

b) por lo menos seis declaraciones? 

c) seis declaraciones exactamente? 
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OA8 Describir las 
características y calcular las 
probabilidades mediante la 
distribución exponencial. 


La distribución exponencial 
tiene un sesgo positivo. 


34. Shorty’s Muffler anuncia que puede instalar un silenciador nuevo en 30 minutos o menos. No obs- 
tante, hace poco el departamento de estándares laborales de las oficinas centrales realizó un estu- 
dio y descubrió que 20% de los silenciadores no se instalaba en 30 minutos o menos. La sucur- 
sal Maumee instaló 50 silenciadores el mes pasado. Si el informe de la empresa es correcto: 

a) ¿Cuántas instalaciones de la sucursal Maumee se esperaría que tardaran más de 30 minutos? 

b ) ¿Cuál es la probabilidad de que ocho o menos instalaciones tarden más de 30 minutos? 

c) ¿Cuál es la probabilidad de que exactamente 8 de las 50 instalaciones tarden más de 30 minu- 
tos? 

35. Un estudio que realizó Taurus Health Club, famoso en Estados Unidos, reveló que 30% de sus nue- 
vos miembros tiene un significativo exceso de peso. Una campaña de promoción de membresías 
en un área metropolitana dio como resultado la captación de 500 nuevos miembros. 

a) Se sugirió utilizar la aproximación normal de la distribución binomial para determinar la proba- 
bilidad de que 175 o más de los nuevos miembros se encuentren muy excedidos de peso. ¿Es 
este problema de naturaleza binomial? Explique. 

b) ¿Cuál es la probabilidad de que 175 o más de los nuevos miembros se encuentren muy pasa- 
dos de peso? 

c) ¿Cuál es la probabilidad de que 140 o más de los nuevos miembros se encuentren muy pasa- 
dos de peso? 

36. Un número reciente de Bride Magazine sugirió que las parejas que planean su boda deben espe- 
rar que dos terceras partes de las personas a las que envían invitación confirmen su asistencia. 
Rich y Stacy tienen planes de casarse este año y piensan enviar 197 invitaciones. 

a) ¿Cuántos invitados esperaría que aceptaran la invitación? 

b) ¿Cuál es la desviación estándar? 

c) ¿Cuál es la probabilidad de que 140 o más acepten la invitación? 

d) ¿Cuál es la probabilidad de que exactamente 140 acepten la invitación? 

7.6 La familia de distribuciones exponenciales 

Hasta ahora, en este capítulo hemos considerado dos distribuciones de probabilidad continua, 
la uniforme y la normal. La siguiente distribución continua que explicaremos es la distribución 
exponencial. Por lo general, esta distribución de probabilidad continua describe los tiempos 
entre eventos que ocurren en secuencia. Las acciones suceden independientemente a un 
ritmo constante por unidad o duración de tiempo. Como el tiempo nunca es negativo, una 
variable aleatoria exponencial será siempre positiva. La distribución exponencial suele descri- 
bir situaciones como: 

• Los tiempos de servicio en un sistema (p.e., cuánto tiempo toma atender a un cliente). 

• El tiempo entre “entradas” en un sitio web. 

• El tiempo de vida de un componente eléctrico. 

• El tiempo que transcurre hasta que la siguiente llamada telefónica llega a un centro de ser- 
vicio al cliente. 

La distribución de probabilidad exponencial tiene un sesgo positivo. En esta característi- 
ca difiere de las distribuciones uniforme y normal, que son simétricas. De hecho, la distribu- 
ción es descrita por un solo parámetro, que identificaremos como X. A menudo, nos referimos 
a X como el parámetro de “ritmo”. La siguiente gráfica muestra el cambio en la forma de la dis- 
tribución exponencial a medida que variamos el valor de X de 1/3 a 1 a 2. Observe que con- 
forme reducimos X, la forma de la distribución cambia para volverse “menos sesgada”. 



x 
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Otra característica de la distribución exponencial es su estrecha relación 
con la distribución de Poisson, una distribución de probabilidad discreta que 
tiene también un solo parámetro, |x. Describimos la distribución de Poisson en 
la sección 6.7 del capítulo 6. También se trata de una distribución con sesgo 
positivo. Para explicar la relación entre la distribución de Poisson y las distri- 
buciones exponenciales, suponga que el ritmo al que los clientes llegan a un 
restaurant familiar durante la hora de la cena es de 6 por hora. Utilizamos la 
distribución de Poisson para determinar la probabilidad de que, en cualquier 
hora de la cena, lleguen 2 clientes, o 7, y así sucesivamente. Así que tenemos 
una distribución de Poisson con una media de 6. Pero suponga que en vez de 
estudiar el número de clientes que llegan en una hora , desea estudiar el tiem- 
po que transcurre entre cada llegada. El tiempo entre llegadas es una distribución continua, 
porque el tiempo se mide como una variable aleatoria continua. Si los clientes llegan a un ritmo 
de 6 por hora, entonces es lógico que el tiempo medio o típico entre llegadas sea de 1/6 de 
hora, o 10 minutos. Es necesario tener cuidado aquí en ser consistentes con nuestras unida- 
des, de manera que quedémonos con 1/6 de hora. Así que en general, si sabemos que los 
clientes llegan a cierto ritmo por hora, al que llamamos |x, podemos esperar que el tiempo 
medio entre llegadas será 1 /pu. El parámetro de ritmo X es igual a 1/|x. Por lo tanto, en este 
ejemplo, X = 1/6. 

La gráfica de la distribución exponencial comienza con el valor de X cuando el valor de la 
variable aleatoria (X) es 0. La distribución desciende de manera uniforme a medida que nos 
desplazamos a la derecha, con valores crecientes de X. La fórmula (7-6) describe la distribu- 
ción de probabilidad exponencial con X como parámetro de ritmo. Como ya se describió en la 
distribución de Poisson en la sección 6.7 en la página 207, e es una constante matemática 
igual a 2.71828. Ésta es la base del sistema logarítmico napieriano. Es una agradable sorpre- 
sa que tanto la media como la desviación estándar de la distribución de probabilidad expo- 
nencial sean iguales a 1/X. 



La media y la desviación P(x) = Ae~ Aj< (7-6) 

estándar de la distribución 
exponencial son iguales a 

1/k. En el caso de las distribuciones continuas, no consideramos la probabilidad de que se 

presente un valor distinto. En vez de eso, las áreas o regiones debajo de la gráfica de la dis- 
tribución de probabilidades entre dos valores especificados dan la probabilidad de que la 
variable aleatoria esté en ese intervalo. No se necesita una tabla de la distribución exponen- 
cial, como la que está en el apéndice B.1, para la distribución normal. El área bajo la función 
de densidad exponencial se determina mediante una fórmula simple, y los cálculos que se 
requieren pueden realizarse con una calculadora de mano que tenga una tecla e x . La mayoría 
de los paquetes de software estadístico también calcula las probabilidades exponenciales con 
sólo ingresar X, el parámetro de ritmo. La probabilidad de obtener un valor de llegada menor 
a un valor particular de x es: 


ENCONTRAR LA PROBABILIDAD USANDO 
LA DISTRIBUCIÓN EXPONENCIAL 


P(Tiempo de llegada < x) = 1 - e ** 


A 


(7-7) 


V 


r 

Cjemplo 

Las órdenes para pedidos de medicamentos por receta llegan a una farmacia virtual de acuer- 
do con una distribución de probabilidad exponencial, a una media de una cada 20 segundos. 


Encuentre la probabilidad de que la siguiente orden llegue en menos de 5 segundos, en más 
de 40 segundos, o entre 5 y 40 segundos. 

Solución 

Para comenzar, se determina el parámetro de ritmo X, que en este caso es 1/20. Para encon- 
trar la probabilidad, se inserta 1/20 en lugar de X y 5 porx en la fórmula (7-7). 


— —( 5 ) 

P(Tiempo de llegada < 5) = 1 - e 20 = 1 - e~ 0 - 25 = 1 - .7788 = .2212 
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En consecuencia, se concluye que hay una probabilidad de 22% de que la siguiente orden lle- 
gue en menos de cinco segundos. La región se identifica como el área color marrón bajo la curva. 



0 10 20 30 40 50 60 70 80 90100 


Los cálculos anteriores señalaron el área en la zona de la cola izquierda de la distribución 
exponencial como \ = 1/20, y el área entre 0 y 5 (es decir, el área que está por debajo de los 
5 segundos). ¿Qué pasa si usted se interesa en el área de la cola derecha? Para encontrarla, 
use la regla del complemento. Vea la fórmula (5-3) en la sección 5.4, página 154, capítulo 5. 
Para decirlo de otra forma, para encontrar la probabilidad de que la siguiente orden llegue en 
más de 40 segundos, se debe hallar la probabilidad de que la orden llegue en menos de 40 
segundos y restar el resultado de 1 .00. Los pasos son: 


1. Encuentre la probabilidad de que una orden sea recibida en menos de 40 segundos. 

P(Llegada < 40) = 1 - e^ <40) = 1 - .1353 = .8647 

2. Encuentre la probabilidad de que una orden sea recibida en más de 40 segundos. 

P(Llegada > 40) = 1 - P(Llegada < 40) = 1 - .8647 = .1353 

Se concluye que la probabilidad de que pasarán 40 segundos o más antes de que se reci- 
ba la siguiente orden en la farmacia virtual es de 13.5 por ciento. 


Como seguramente habrá observado, existe cierta redundancia en este ejemplo. En general, 
si deseamos encontrar la probabilidad de un tiempo mayor que algún valor X, como 40 en las 
ecuaciones anteriores. Entonces: 

P(Llegada > X) = 1 - P(Llegada < X) = (1 — e~ kx ) = e~ kx 
En otras palabras, reste la fórmula (7-7) del número 1 , y el área en la cola derecha es e _kx . 
Por ello, la probabilidad de que pasen 40 segundos antes de que llegue la siguiente orden se 
calcula directamente, sin la ayuda de la regla del complemento, en la forma siguiente: 



Si desea determinar la probabilidad de que pasarán más de 5 segundos pero menos de 
40 segundos para que llegue la siguiente orden, use la fórmula (7-7) con un valor x de 40, y 
reste el valor de la fórmula (7-7) donde x es 5. 
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En símbolos, puede escribirlo así: 

P ( 5 < x < 40) = P(Llegada < 40) - P(Llegada < 5) 

— — (40) -—(5) 

= (1 - e 20 ) - (1 - e 20 ) = .8647 - .2212 = .6435 

Se concluye que 64% del tiempo, el lapso entre órdenes será entre 5 y 40 segundos. 
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En los ejemplos anteriores se debe encontrar el porcentaje de las observaciones ubicadas 
entre dos valores, o el porcentaje de las observaciones que está por encima o por debajo de 
un valor particular, x. También podemos utilizar la fórmula (7-7) “en reversa” para encontrar el 
valor de la observación x cuando el porcentaje es superior o Inferior a la observación. El 
siguiente ejemplo ¡lustra esta situación. 



Compton Computers desea establecer una garantía mínima de tiempo de vida para su nueva 
unidad de fuente de poder. Las pruebas de calidad muestran que el tiempo de falla sigue una 
distribución exponencial con una media de 4 000 horas. Compton quiere un periodo de garan- 
tía en cuyo transcurso sólo falle 5% de las fuentes de poder. ¿Qué valor debe establecer para 
el periodo de garantía? 

Observe que 4 000 horas es una media y no un ritmo. Por lo tanto, debemos establecer \ como 
1/4 000, o 0.00025 fallas por hora. A continuación se muestra un diagrama de la situación, 
donde x representa el tiempo de vida mínimo garantizado. 



Utilice la fórmula (7-7) y, básicamente, trabaje hacia atrás para hallar la solución. En este caso, 
el parámetro de ritmo es 4 000 horas y queremos que dicha área sea 0.05, tal como se mues- 
tra en el diagrama. 

P(Tiempo de llegada < x) = 1 - e ( ~ Ax) 


.05 = 1 -e 4000 


M 
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En seguida, resolvemos la ecuación para x. Por lo tanto, restamos 1 de ambos lados de la 
ecuación y multiplicamos por -1 para simplificar los signos. El resultado es: 

- 

.95 = e ^ ooo 

El siguiente paso es tomar el logaritmo natural de ambos lados y lo resolvemos para x: 

1 


ln(.95) = - 
-(.051293294)= - 


4 000 
1 

4 000 ^ 
x = 205.17 


-x 


En este caso, x = 205.17. De esta forma, Compton puede establecer el periodo de garantía en 
205 horas, y esperar que alrededor de 5% de las fuentes de poder será devuelto. 



El tiempo entre la llegada de ambulancias a la sala de urgencias del Methodist Hospital sigue una 
distribución exponencial, con una media de 10 minutos. 

a) ¿Cuál es la probabilidad de que la próxima ambulancia llegue en 15 minutos o menos? 

b) ¿Cuál es la probabilidad de que la próxima ambulancia llegue en más de 25 minutos? 

c) ¿Cuál es la probabilidad de que la próxima ambulancia llegue en más de 1 5 minutos, pero menos 
de 25? 

d) Encuentre el 80o. percentil para el tiempo entre las llegadas de las ambulancias. (Esto significa 
que sólo un 20% de las corridas son más largas que este lapso.) 


comed: 


Ejercicios 

37. Los tiempos de espera para recibir la comida después de hacer el pedido en la tienda Subway 
local siguen una distribución exponencial con una media de 60 segundos. Calcule la probabilidad 
de que un cliente espere: 

a) Menos de 30 segundos. 

b) Más de 120 segundos. 

c) Entre 45 y 75 segundos. 

d) ¿Cincuenta por ciento de los clientes espera menos de cuántos segundos? ¿Cuál es la me- 
diana? 

38. El tiempo de vida de los televisores de plasma y LCD sigue una distribución exponencial con una 
media de 100 000 horas. Calcule la probabilidad de que un televisor: 

a) Falle en menos de 10 000 horas. 

b) Dure más de 120 000 horas. 

c) Falle entre 60 000 y 1 00 000 horas de uso. 

d) Encuentre el 90o. percentil. ¿Diez por ciento de los televisores duran más de cuánto tiempo? 

39. La encuesta realizada por The Bureau of Labor Statitics’ American Time mostró que el tiempo que 
se pasa en Estados Unidos utilizando una computadora para entretenimiento varía mucho según 
la edad. Los individuos de 75 años en adelante promediaron 0.3 horas (18 minutos) por día. Los 
de 15 a 19 años pasaban 1.0 hora al día. Si estos tiempos siguen una distribución exponencial, 
encuentre la proporción de cada grupo que pasa: 

a) Menos de 15 minutos al día usando la computadora para entretenimiento. 

b) Más de dos horas. 

c) Entre 30 y 90 minutos. 

d) Encuentre el 20o. percentil. ¿Ochenta por ciento pasan más de cuánto tiempo? 

40. El costo por artículo en el supermercado sigue una distribución exponencial. Hay muchos artícu- 
los baratos y pocos que son relativamente caros. El costo medio por artículo es de $3.50. ¿Cuál 
es el porcentaje de artículos que cuestan: 

a) menos de $1? 

b) más de $4? 

c) entre $2 y $3? 

d) Encuentre el 40o. percentil. ¿Sesenta por ciento de los artículos del supermercado cuestan 
más de cuánto? 



Resumen del capítulo 
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Resumen del capítulo 

I. La distribución uniforme es una distribución de probabilidad continua con las siguientes caracterís- 
ticas: 

A. Tiene forma rectangular. 

B. La media y la mediana son iguales. 

C. Queda completamente descrita por su valor mínimo a y su valor máximo b. 

D. También queda descrita por la siguiente ecuación de la región de a a b. 

P(x) = 1 (7-3) 

b — a 


E. La media y la desviación estándar de una distribución uniforme se calculan de la siguiente manera: 

(a + b) 


p = 


(b - af 


12 


(7-1) 

(7-2) 


II. La distribución de probabilidad normal es una distribución continua con las siguientes caracterís- 
ticas: 

A. Tiene forma de campana y posee una sola cima en el centro de la distribución. 

B. La distribución es simétrica. 

C. Es asintótica, lo cual significa que la curva se aproxima al eje X sin tocarlo jamás. 

D. Se encuentra completamente descrita por su media y su desviación estándar. 

E. Existe una familia de distribuciones de probabilidad normal. 

1. Se genera otra distribución de probabilidad normal cuando cambia la media o la desviación 
estándar. 

2. La distribución de probabilidad normal queda descrita por medio de la fórmula: 


P(x) 


1 


aV 2tt 




(7-4) 


distribución de probabilidad normal estándar es una distribución normal particular. 

Posee una media de 0 y una desviación estándar de 1 . 

Toda distribución de probabilidad normal puede convertirse en una distribución de probabilidad 
normal estándar mediante la fórmula: 


C. Al estandarizar una distribución de probabilidad normal, se indica la distancia de un valor de la 
media en unidades de desviación estándar. 

IV. La distribución de probabilidad normal puede aproximar una distribución binomial en ciertas con- 
diciones. 

A. nir y n(1 - tt) deben ser (ambos) por lo menos 5. 

1. n es el número de observaciones. 

2. tt es la probabilidad de un éxito. 

B. Las cuatro condiciones de una distribución de probabilidad binomial son: 

1. Sólo hay dos posibles resultados. 

2. tt permanece igual de una prueba a otra. 

3. Las pruebas son independientes. 

4. La distribución es el resultado de la enumeración del número de éxitos en una cantidad fija 
de pruebas. 

C. La media y la varianza de una distribución binomial se calculan de la siguiente manera: 


III. La 

A. 

B. 


(jl = m t 

a 2 = /7 tt(1 — tt) 
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D. El factor de corrección de continuidad de 0.5 se emplea para extender el valor continuo de X 
media unidad en cualquier dirección. Esta corrección compensa la aproximación a una distribu- 
ción discreta por medio de una distribución continua. 

V. La distribución de probabilidad exponencial describe los tiempos entre eventos que forman una 

secuencia. 

A. Las acciones ocurren independientemente, a un ritmo constante por unidad o duración de 
tiempo. 

B. La densidad de la probabilidad se calcula mediante la fórmula: 

P(x) = Ae~ A * (7-6) 

C. Es no negativa, de sesgo positivo, declina uniformemente hacia la derecha, y es asintótica. 

D. El área bajo la curva se calcula mediante la fórmula: 

P (Tiempo de llegada < x) = 1 - e~ A * (7-7) 

E. Tanto la media como la desviación estándar son 1/A. 


comed 


Ejercicios del copítulo 

41 . La cantidad de bebida de cola en una lata de 1 2 onzas tiene una distribución uniforme entre 1 1 .96 
y 12.05 onzas. 

a) ¿Cuál es la cantidad media de bebida por lata? 

b) ¿Cuál es la desviación estándar de la cantidad de bebida por lata? 

c) ¿Cuál es la probabilidad de elegir una lata de bebida de cola que contenga menos de 1 2 onzas? 

d) ¿Cuál es la probabilidad de elegir una lata de bebida de cola que contenga más de 11.98 
onzas? 

e) ¿Cuál es la probabilidad de elegir una lata de bebida de cola que contenga más de 1 1 onzas? 

42. Un tubo de pasta dental Listerine Control Tartar contiene 4.2 onzas. Conforme la gente utiliza la 
pasta, la cantidad que queda en cualquier tubo es aleatoria. Suponga que la cantidad de pasta 
restante en el tubo tiene una distribución uniforme. De acuerdo con estos datos, es posible deter- 
minar la siguiente información relativa a la cantidad restante de un tubo de pasta dental sin inva- 
dir la privacidad de nadie. 

a) ¿Cuánta pasta esperaría que quedara en el tubo? 

ib) ¿Cuál es la desviación estándar de la pasta que queda en el tubo? 

c) ¿Cuál es la posibilidad de que en el tubo queden menos de 3.0 onzas? 

d) ¿Cuál es la posibilidad de que en el tubo queden más de 1.5 onzas? 

43. Muchas tiendas de menudeo ofrecen sus propias tarjetas de crédito. En el momento de hacer la 
solicitud de crédito, el cliente recibe un descuento de 10% sobre la compra. El tiempo que se 
requiere para el proceso de la solicitud de crédito se rige por una distribución uniforme con tiem- 
pos que varían de 4 a 10 minutos. 

a) ¿Cuál es el tiempo medio que dura el proceso de la solicitud? 

¿>) ¿Cuál es la desviación estándar del tiempo de proceso? 

c) ¿Cuál es la probabilidad de que una solicitud tarde menos de 6 minutos? 

d) ¿Cuál es la probabilidad de que una solicitud tarde más de 5 minutos? 

44. El tiempo que los huéspedes del hotel Grande Dunes, de Bahamas, esperan el ascensor tiene una 
distribución uniforme de entre 0 y 3.5 minutos. 

a) Demuestre que el área bajo la curva es de 1 .00. 

b) ¿Cuánto tiempo espera el cliente habitual el servicio de elevador? 

c) ¿Cuál es la desviación estándar del tiempo de espera? 

d) ¿Qué porcentaje de huéspedes espera menos de un minuto? 

e) ¿Qué porcentaje de huéspedes espera más de dos minutos? 

45. Las ventas netas y el número de empleados de fabricantes de aluminio con características simila- 
res están organizados en una distribución de frecuencias. Ambos tienen distribuciones normales. 
La media de las ventas netas es de $180 millones, y la desviación estándar, de $25 millones. En el 
caso del número de empleados, la media es de 1 500, y la desviación estándar, de 120. Clarion 
Fabricators realizó ventas por $170 millones y tiene 1 850 empleados. 

a) Convierta las ventas y el número de empleados de Clarion en valores z. 

b) Localice los dos valores z. 

c) Compare las ventas de Clarion y su número de empleados con los de otros fabricantes. 

46. El departamento de contabilidad de Weston Materials, Inc., fabricante de cocheras desmontables, 
indica que dos trabajadores de la construcción tardan una media de 32 horas, con una desviación 
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estándar de dos horas, para armar el modelo Red Barn. Suponga que los tiempos de montaje tie- 
nen una distribución normal. 

a) Determine los valores z de 29 y 34 horas. ¿Qué porcentaje de cocheras requiere entre 32 y 34 
horas de armado? 

b) ¿Qué porcentaje de cocheras requiere entre 29 y 34 horas de armado? 

c) ¿Qué porcentaje de cocheras requiere 28.7 horas o menos de armado? 

d) ¿Cuántas horas se requieren para armar 5% de las cocheras? 

47. Un informe reciente publicado en USA Today indicaba que una familia común de cuatro miembros 
gasta $490 al mes en alimentos. Suponga que la distribución de gastos de alimento de una fami- 
lia de cuatro miembros sigue una distribución normal, con una media de $490 y una desviación 
estándar de $90. 

a) ¿Qué porcentaje de familias gasta más de $30 y menos de $490 en alimentos al mes? 

b) ¿Qué porcentaje de familias gasta menos de $430 al mes en alimentos? 

c) ¿Qué porcentaje de familias gasta entre $430 y $600 mensuales en alimentos? 

d) ¿Qué porcentaje de familias gasta entre $500 y $600 mensuales en alimentos? 

48. Un estudio de llamadas telefónicas de larga distancia que se realizó en las oficinas centrales de 
Pepsi Botting Group, Inc., en Somers, Nueva York, demostró que las llamadas, en minutos, se 
rigen por una distribución de probabilidad normal. El lapso medio de tiempo por llamada fue de 
4.2 minutos, con una desviación estándar de 0.60 minutos. 

a) ¿Qué porcentaje de llamadas duró entre 4.2 y 5 minutos? 

b) ¿Qué porcentaje de llamadas duró más de 5 minutos? 

c) ¿Qué porcentaje de llamadas duró entre 5 y 6 minutos? 

d) ¿Qué porcentaje de llamadas duró entre 4 y 6 minutos? 

e) Como parte de su informe al presidente, el director de comunicaciones desea informar la dura- 
ción de 4% de las llamadas más largas. ¿Cuál es este tiempo? 

49. Shaver Manufacturing, Inc., ofrece a sus empleados seguros de atención dental. Un estudio 
reciente realizado por el director de recursos humanos demuestra que el costo anual por emplea- 
do tuvo una distribución de probabilidad normal, con una media de $1 280 y una desviación están- 
dar de $420 anuales. 

a) ¿Qué porcentaje de empleados generó más de $1 500 anuales de gastos dentales? 

b) ¿Qué porcentaje de empleados generó entre $1 500 y $2 000 anuales de gastos dentales? 

c) Calcule el porcentaje que no generó gastos por atención dental. 

d) ¿Cuál fue el costo de 10% de los empleados que generó gastos más altos por atención den- 
tal? 

50. Las comisiones anuales que percibieron los representantes de ventas de Machine Products, Inc., 
fabricante de maquinaria ligera, tienen una distribución de probabilidad normal. El monto anual 
medio percibido es de $40 000, y la desviación estándar, de $5 000. 

a) ¿Qué porcentaje de representantes de ventas percibe más de $42 000 anuales? 

b) ¿Qué porcentaje de representantes de ventas percibe entre $32 000 y $42 000 anuales? 

c) ¿Qué porcentaje de representantes de ventas percibe entre $32 000 y $35 000 anuales? 

d) El gerente desea gratificar a los representantes de ventas que perciben las comisiones más 
altas con un bono de $1 000. Les puede conceder un bono a 20% de ellos. ¿Cuál es el límite 
entre los que obtienen un bono y quienes no lo obtienen? 

51. De acuerdo con el South Dakota Department of Health, la media de la cantidad de horas que se 
ve televisión a la semana es más alta entre mujeres adultas que entre hombres. Un estudio recien- 
te mostró que las mujeres ven televisión un promedio de 34 horas a la semana, y los hombres, 29 
horas a la semana. Suponga que la distribución de horas que ven televisión tiene una distribución 
normal en ambos grupos, y que la desviación estándar entre las mujeres es de 4.5 horas, mientras 
que en los hombres es de 5.1 horas. 

a) ¿Qué porcentaje de mujeres ve televisión menos de 40 horas a la semana? 

b) ¿Qué porcentaje de hombres ve televisión más de 25 horas a la semana? 

c) ¿Cuántas horas de televisión ve 1 % de las mujeres que ve más televisión por semana? En- 
cuentre el valor comparable en el caso de los hombres. 

52. De acuerdo con un estudio del gobierno, entre los adultos de 25 a 34 años de edad, la suma media 
que gastan cada año en lectura y entretenimiento es de $1 994. Suponga que la distribución de 
las sumas que se gastan tiene una distribución normal, con una desviación estándar de $450. 

a) ¿Qué porcentaje de adultos gastó más de $2 500 anuales en lectura y entretenimiento? 

b) ¿Qué porcentaje gastó entre $2 500 y $3 000 anuales en lectura y entretenimiento? 

c) ¿Qué porcentaje gastó menos de $1 000 anuales en lectura y entretenimiento? 

53. La administración de Gordon Electronics piensa instituir un sistema de bonos para incrementar la 
producción. Una sugerencia consiste en pagar un bono sobre el 5% más alto de la producción 
tomado de la experiencia previa. Los registros del pasado indican que la producción semanal tiene 
una distribución normal. La media de esta distribución es de 4 000 unidades a la semana, y la des- 
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viación estándar es de 60 unidades semanales. Si el bono se paga sobre el 5% más alto de pro- 
ducción, ¿a partir de cuántas unidades se debe pagar? 

54. Fast Service Truck Lines utiliza exclusivamente el Ford Super Duty F-750. La administración reali- 
zó un estudio acerca de los costos de mantenimiento y determinó que el número de millas que se 
recorrieron durante el año tenía una distribución normal. La media de la distribución fue de 60 000 
millas, y la desviación estándar, de 2 000 millas. 

a) ¿Qué porcentaje de los Ford Super Duty-750 registró en su bitácora 65 200 millas o más? 
ib) ¿Qué porcentaje de los Ford Super Duty-750 registró en su bitácora más de 57 060 millas y 
menos de 58 280? 

c) ¿Qué porcentaje de los Ford Super Duty-750 recorrió 62 000 millas o menos durante el año? 

d) ¿Es razonable concluir que ninguno de los camiones recorrió más de 70 000 millas? Explique. 

55. Best Electronics, Inc., promueve una política de devoluciones sin complicaciones. La cantidad de 
artículos devueltos al día tiene una distribución normal. La cantidad media de devoluciones de los 
clientes es de 10.3 diario, y la desviación estándar, de 2.25 diario. 

a) ¿Qué porcentaje de días hay 8 o menos clientes que devuelven artículos? 
ib) ¿Qué porcentaje de días hay entre 12 y 14 clientes que devuelven artículos? 
c) ¿Existe alguna probabilidad de que haya un día sin devoluciones? 

56. Un informe reciente de BusinessWeek señala que 20% de los empleados le roba a la empresa 
cada año. Si una compañía tiene 50 empleados, ¿cuál es la probabilidad de que: 

a) menos de 5 empleados roben? 

b) más de 5 empleados roben? 

c) exactamente 5 empleados roben? 

d) más de 5 empleados y menos de 15 roben? 

57. Como parte de su suplemento dominical dedicado a la salud, ei diario Orange County Register 
informó que 64% de los varones estadounidenses mayores de 18 años considera la nutrición una 
prioridad en su vida. Suponga que se elige una muestra de 60 hombres. ¿Cuál es la probabilidad 
de que: 

a) 32 o más hombres consideren importante la nutrición? 

b) 44 o más hombres la consideren importante? 

c) más de 32 y menos de 43 la consideren importante? 

d) exactamente 44 hombres la consideren importante? 

58. Se calcula que 10% de los alumnos que presentan la parte correspondiente a métodos cuantita- 
tivos del examen Certified Public Account (CPA) la reprobará. Este sábado presentarán el examen 
60 estudiantes. 

a) ¿Cuántos esperaría que reprueben? ¿Cuál es la desviación estándar? 

b) ¿Cuál es la probabilidad de que reprueben exactamente 2 estudiantes? 

c) ¿Cuál es la probabilidad de que reprueben por lo menos 2 estudiantes? 

59. La Traffic División de Georgetown, Carolina del Sur, informó que 40% de las persecuciones de 
automóviles da como resultado algún accidente grave o leve. Durante el mes en que ocurren 50 
persecuciones de alta velocidad, ¿cuál es la probabilidad de que 25 o más terminen en un acci- 
dente grave o leve? 

60. Ochenta por ciento de las habitaciones de los cruceros de la línea Royal Viking se encuentra ocu- 
pado durante septiembre. En el caso de un crucero con 800 habitaciones, ¿cuál es la probabilidad 
de que 665 o más habitaciones se encuentren ocupadas ese mes? 

61. El objetivo de los aeropuertos de Estados Unidos que tienen vuelos internacionales consiste en 
autorizar estos vuelos en un lapso de 45 minutos. Es decir, 95% de los vuelos se autoriza en un 
periodo de 45 minutos, y la autorización del 5% restante tarda más. Suponga, asimismo, que la 
distribución es aproximadamente normal. 

a) Si la desviación estándar del tiempo que se requiere para autorizar un vuelo internacional es de 
5 minutos, ¿cuál es el tiempo medio para autorizar un vuelo? 

b) Suponga que la desviación estándar es de 10 minutos, no los 5 del inciso a). ¿Cuál es la nueva 
media? 

c) Un cliente tiene 30 minutos para abordar su limusina a partir del momento que aterriza su avión. 
Con una desviación estándar de 10 minutos, ¿cuál es la probabilidad de que cuente con tiem- 
po suficiente para subir a la limusina? 

62. Los fondos que despacha el cajero automático localizado cerca de las cajas en un centro comer- 
cial de Kroger, en Union, Kentucky, tienen una distribución de probabilidad normal con una media 
de $4 200 al día y una desviación estándar de $720 al día. La máquina se encuentra programada 
para notificar al banco más próximo si la cantidad que despacha el cajero es muy baja (menor que 
$2 500) o muy alta (más de $6 000). 

a) ¿Qué porcentaje de días se notificará al banco si la cantidad despachada es muy baja? 

b) ¿Qué porcentaje de días se notificará al banco si la cantidad despachada es muy alta? 

c) ¿Qué porcentaje de días no se notificará al banco la cantidad despachada? 


Ejercicios del capítulo 
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63 . Los pesos del jamón enlatado por la compañía Henline Ham tienen una distribución normal, con 
una media de 9.20 libras y una desviación estándar de 0.25 libras. En la etiqueta aparece un peso 
de 9.00 libras. 

a) ¿Qué proporción de latas pesa menos de la cantidad que señala la etiqueta? 

b) El propietario, Glen Henline, considera dos propuestas para reducir la proporción de latas 
debajo del peso de etiqueta. Puede incrementar el peso medio a 9.25 y dejar igual la desvia- 
ción estándar, o puede dejar el peso medio en 9.20 y reducir la desviación estándar de 0.25 a 
0.15 libras. ¿Qué cambio le recomienda? 

64 . El Cincinnati Enquirer, en su suplemento sabatino de negocios, informó que la cantidad media de 
horas trabajadas por semana por empleados de tiempo completo es de 43.9. El artículo indicó, 
además, que alrededor de una tercera parte de los empleados de tiempo completo trabaja menos 
de 40 horas a la semana. 

a) De acuerdo con esta información, y en el supuesto de que la cantidad de horas de trabajo tiene 
una distribución normal, ¿cuál es la desviación estándar de la cantidad de horas trabajadas? 
£>) El artículo indicó incluso que 20% de los empleados de tiempo completo trabaja más de 49 
horas a la semana. Determine la desviación estándar con esta información. ¿Son similares las 
dos aproximaciones de la desviación estándar? ¿Qué concluiría usted? 

65 . La mayoría de las rentas de automóviles por cuatro años abarcan hasta 60 000 millas. Si el arren- 
dador rebasa esa cantidad, se aplica una sanción de 20 centavos la milla de renta. Suponga que 
la distribución de millas recorridas en rentas por cuatro años tiene una distribución normal. La 
media es de 52 000 millas, y la desviación estándar, de 5 000 millas. 

a) ¿Qué porcentaje de rentas generará una sanción como consecuencia del exceso en millas? 

b) Si la compañía automotriz quisiera modificar los términos de arrendamiento de manera que 25 
rentas rebasaran el límite de millas, ¿en qué punto debe establecerse el nuevo límite superior? 

c) Por definición, un automóvil de bajo millaje es uno con 4 años de uso y que ha recorrido menos 
de 45 000 millas. ¿Qué porcentaje de automóviles devueltos se considera de bajo millaje? 

66. El precio de las acciones del Banco de Florida al final de cada jornada de comercialización del año 
pasado se rigió por una distribución normal. Suponga que durante el año hubo 240 jornadas de 
comercialización. El precio medio fue de $42.00 por acción, y la desviación estándar, de $2.25 por 
acción. 

a) ¿Qué porcentaje de jornadas el precio estuvo arriba de $45.00? ¿Cuántas jornadas calcularía 
usted? 

b) ¿Qué porcentaje de jornadas el precio osciló entre $38.00 y $40.00? 

c) ¿Cuál fue el precio de las acciones que se mantuvo más alto 15% de las jornadas? 

67 . Las ventas anuales de novelas románticas tienen una distribución normal. Ahora bien, no se cono- 
ce la media ni la desviación estándar. Cuarenta por ciento del tiempo, las ventas son superiores a 
470 000, y 10%, superiores a 500 000. ¿Cuáles son la media y la desviación estándar? 

68. Al establecer garantías en aparatos HDTV, el fabricante pretende establecer los límites de manera 
que pocos aparatos requieran reparación con cargo a él. Por otra parte, el periodo de garantía 
debe ser lo bastante prolongado para que la compra resulte atractiva para el comprador. La media 
del número de meses que abarca la garantía de un HDTV es de 36.84, con una desviación están- 
dar de 3.34 meses. ¿En qué punto deben establecerse los límites de garantía de manera que sólo 
10% de los aparatos HDTV requiera reparación con cargo al fabricante? 

69 . DeKorte Tele Marketing Inc., considera la compra de una máquina que selecciona aleatoriamente 
y en forma automática marca números telefónicos. La compañía realiza la mayoría de sus llama- 
das durante la tarde, así que las llamadas a teléfonos comerciales son un desperdicio. El fabrican- 
te de la máquina argumenta que su programación reduce las llamadas a teléfonos comerciales a 
15% de todas las llamadas. Para probar lo que dice, el director de compras de DeKorte programó 
la máquina para seleccionar una muestra de 150 números telefónicos. ¿Cuál es la probabilidad de 
que más de 30% de los números seleccionados sean comerciales, asumiendo que el argumento 
del fabricante es correcto? 

70 . Un detector de monóxido de carbono en el hogar de los Wheelock se activa una vez cada 200 días 
en promedio. Suponga que esta activación tiene una distribución exponencial. ¿Cuál es la proba- 
bilidad de que: 

a) haya una alarma dentro de los siguientes 60 días? 

b) pasen cuando menos 400 días antes de la siguiente alarma? 

c) pasen entre 1 50 y 250 días hasta la próxima alarma? 

d ) Encuentre el tiempo mediano hasta la siguiente activación. 

71 . El “tiempo de bufeo” (el lapso que transcurre entre la aparición de la pantalla del Bios hasta que 
el primer archivo es cargado en Windows) de la computadora personal de Eric Mouser sigue una 
distribución exponencial, con una media de 27 segundos. ¿Cuál es la probabilidad de que este 
“bufeo” requerirá: 

a) menos de 15 segundos? 
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ib) más de 60 segundos? 

c) entre 30 y 45 segundos? 

d) ¿Cuál es el punto debajo del cual ocurre sólo 10% de los buteos? 

72. En Estados Unidos, el tiempo entre visitas a una sala de urgencias de un miembro de la población 
general sigue una distribución exponencial, con una media de 2.5 años. ¿Qué proporción de la 
población visitará una sala de urgencias: 

a) dentro de los próximos seis meses? 

ib) no visitará la sala de urgencias en los próximos seis años? 

c) el siguiente año, pero no éste? 

d) Encuentre el primer y el tercer cuartiles de esta distribución. 

73. Los tiempos entre fallas en una computadora personal siguen una distribución exponencial, con 
una media de 300 000 horas. ¿Cuál es la probabilidad de que: 

a) ocurra una falla en menos de 100 000 horas? 

b) no haya fallas en las siguientes 500 000 horas? 

c) la siguiente falla ocurra dentro de 200 000 a 350 000 horas? 

d) ¿Cuáles son la media y la desviación estándar del tiempo entre fallas? 

Ejercicios de lo base de datos 

74. Consulte los datos de Real Estate, que incluyen información sobre las casas que se vendieron en 
la zona de Goodyear, Arizona, el año pasado. 

a) El precio de venta medio (en miles de dólares) de las casas se calculó en $221 .10, con una des- 
viación estándar de $47.11. Utilice la distribución normal para calcular el porcentaje de casas 
que se vende en más de $280.0. Compare con los resultados reales. ¿La distribución normal 
genera una buena aproximación de los resultados reales? 
ib) La distancia media desde el centro de la ciudad es de 14.629 millas, con una desviación están- 
dar de 4.874 millas. Utilice la distribución normal para calcular la cantidad de casas que se ubi- 
can a 18 o más millas y a menos de 22 millas del centro de la ciudad. Compare con los resul- 
tados reales. ¿La distribución normal ofrece una buena aproximación de los resultados reales? 

75. Consulte los datos de Baseball 2009, que Incluyen información sobre los 30 equipos de la Liga 
Mayor de Béisbol de la temporada 2009. 

a) La asistencia media por equipo en la temporada fue de 2 448 millones, con una desviación 
estándar de 0.698 millones. Utilice la distribución normal para calcular el número de equipos 
con asistencias superiores a 3.5 millones. Compare este resultado con el número real. Comente 
sobre la exactitud del cálculo. 

ib) El salario medio por equipo fue de $88.51 millones, con una desviación estándar de $33.90 
millones. Utilice la distribución normal para calcular el número de equipos con un salario supe- 
rior a los $50 millones. Compare este resultado con la cantidad real. Comente sobre la exacti- 
tud de su aproximación. 

76. Consulte los datos de los autobuses del Distrito Escolar Buena. 

a) Refiérase a la variable del costo de mantenimiento. El costo medio de mantenimiento del año 
pasado fue de $450.29, con una desviación estándar de 53.69. Estime el número de autobuses 
con un costo de más de $500. Compare con el número real. 

b) Refiérase a la variable del número de millas recorridas. La media es 830.11 y la desviación 
estándar 42.19 millas. Estime el número de autobuses que viajan más de 900 millas. Compare 
con el número del valor real. 


Comandos de software 


1. Los comandos de Excel que se requieren para generar la 
pantalla de la página 235 son los siguientes: 
a) Haga clic en la pestaña de Formulas en la barra de 
herramientas, y seleccione Inserí Function fx en el 
extremo izquierdo. Del recuadro de categorías, seleccio- 
ne Statistical, y debajo, NORMDIST, y haga clic en OK. 


b) En el cuadro de diálogo escriba 1100 en el cuadro 
correspondiente a X; 1000 para la Mean; 100 para la 

Standard dev; True en el cuadro Cumulative y haga 
clic en OK. 

c) El resultado aparecerá en el cuadro de diálogo. Si hace 
clic en OK, la respuesta aparecerá en su hoja de cálculo. 


Respuestas a las autoevaluaciones 

2. Los comandos de Excel que se requieren para generar la 
pantalla de la página 241 son los siguientes: 

a) Haga clic en la pestaña de Formulas en la barra de 
herramientas, y seleccione Insert Function fx en el 
extremo izquierdo. Del recuadro de categorías, seleccio- 
ne Statistical, y debajo, NORMINV, y haga clic en OK. 

b) En el cuadro de diálogo, escriba 0.04 en Probability; 
67900 en Mean, y 2050 en Standard dev. 
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c) Los resultados aparecerán en el cuadro de diálogo. 
Observe que la respuesta es diferente a la de la página 
240, como consecuencia del error de redondeo. Si hace 
clic en OK, la respuesta también aparece en su hoja de 
cálculo. 

d) Intente introducir una Probability de 0.04, una Mean de 
0 y una Standard dev de 7. Se calculará el valor z. 


Capítulo 7 Respuestas a las autoevaluaciones 




b) P(x) = (alturaj(base) 
1 


14-8 
1 


(14 - 8) 


( 6 ) = 1 .00 


c) p. = 


+ b _ 14 + 8 _ 22 
2 ~ 2 ~ 2 ~ 


l(b - a) 2 

1 

00 

1 

12 V 

12 v 


= V3 


= 1.73 

d) P(10 <x < 14) = (altura)(base) 
1 


14-8 


(14 - 10) 


= .667 

e) P{x < 9) = (altura)(base) 

1 


J4 - 8 
= 0.167 


(9-8) 


7-2 a) 2.25, que se calcula: 

_ $1 225 - $1 000 _ $225 
$100 _ $100 
b) -2.25, que se calcula: 

_ $775 - $1 000 _ -$225 
z ” $100 ~ $100 

7-3 a) $46 400 y $48 000, que se obtienen mediante el 
cálculo de $47 200 ± 1 ($800). 
b) $45 600 y $48 800, que se obtienen mediante el 
cálculo de $47 200 ± 2($800). 


= 2.25 


= -2.25 


c) $44 800 y $49 600, que se obtienen mediante el 
cálculo de $47 200 ± 3($800). 

d) $47 200. La media, la mediana y la moda son iguales 
para una distribución normal. 

e) Sí; una distribución normal es simétrica. 


7-4 a) Cálculo de z: 


154 - 150 

z = = 0.80 


De acuerdo con el apéndice B.1 , el área es de 0.2881 . 
Así que P(1 50 < temp < 1 54) = 0.2881 . 
b) Cálculo de z: 

164 - 150 

z = = 2.80 

5 

De acuerdo con el apéndice B.1 , el área es de 0.4974. Así 
que P(164 > temp) = 0.5000 - 0.4974 = 0.0026. 

7-5 a) Cálculo de los valores z: 

146 - 150 156 - 150 

z = = -0.80 y z = = 1 .20 

5 5 

P(1 46 < temp < 1 56) = P(- 0.80 < z < 1 .20) = 0.2881 
+ 0.3948 = 0.6829. 
b) Cálculo de los valores z: 

162 - 150 156 - 150 

z = = 2.40 y z = =1.20 

5 5 

P(1 56 < temp < 1 62) = P(1 .20 < z < 2.40) 

= 0.4918 - 0.3849 = 0.1069 

7-6 85.24 (sin duda, el profesor lo convertirá en 85). El área 

más próxima a 0.4000 es de 0.3997; z equivale a 1 .28. 

Por consiguiente: 

X - 75 


1.28 = : 


8 


10.24 = X - 75 
X = 85.24 

7-7 a) 0.0465, que se calcula mediante p, = mr = 200(0.80) 
= 160 y CT 2 = nir (1 - ir) = 200(.80)(1 - 0.80) = 32. 
Entonces, 

a = V32 = 5.66 

169.5 - 160 

z = —— r = 1 -68 


z = 


5.66 
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De acuerdo con el apéndice B.1, el área es de 0.4535. 
Al restar de 0.5000, se obtiene 0.0465. 
b) 0.9686, que se calcula mediante 0.4686 + 0.5000. 
Primero se calcula z: 


149.5 - 160 
5456 


- 1.86 


De acuerdo con el apéndice B.1 , el área es de 0.4686. 


7-8 a) 0.7769, que se calcula mediante: 


P(Llegada < 15) = 1 - e 1D 

= 1 - .2231 = .7769 
b) 0.0821, que se calcula mediante: 

P(Llegada < 25) = e^ <15) = .0821 


c) 0.1410, que se calcula mediante: 

P(15 < x < 25) = P( Llegada < 25) - P(Llegada 15) 
= .9179 - .7769 = .1410 

d) 16 .09 minutos, que se calcula mediante: 


1 

~ io x 

= — ( — 1 .609)(1 0) = 1.609(10) = 16.09 


.80 
-In 0.20 
x 


Repaso de los capítulos 5 a 7 

En esta sección se realiza un repaso de los conceptos, términos, símbolos y ecuaciones más impor- 
tantes de los capítulos 5, 6 y 7. En estos tres capítulos se estudian los métodos para hacer frente a la 
incertidumbre. Como ejemplo de incertidumbre en los negocios, considere el papel que desempeña el 
departamento de control de calidad en la mayoría de las empresas de producción masiva. Por lo gene- 
ral, el departamento no tiene personal ni tiempo para verificar, por ejemplo, los 200 módulos con cone- 
xión producidos durante un periodo de dos horas. Tal vez el procedimiento de operación convencional 
exija la selección de una muestra de 5 módulos y el envío de los 200 módulos en caso de que los 5 
funcionen adecuadamente. Sin embargo, si uno o más elementos que integran la muestra se encuen- 
tran defectuosos, se verifican los 200. Si los 5 módulos funcionan, el personal de control de calidad no 
puede estar seguro de que lo que hacen (permitir el envío de los módulos) sea lo correcto. El estudio 
de la probabilidad permite medir la incertidumbre del envío de módulos defectuosos. Asimismo, la pro- 
babilidad como medida de incertidumbre entra en juego cuando SurveyUSA, The Gallop Poli, Zogby y 
otras empresas dedicadas a realizar encuestas de opinión miden la opinión pública en temas tales 
como los impuestos y el cuidado de la salud. 

En el capítulo 5 se hace referencia al hecho de que una probabilidad es un valor entre 0 y 1 , inclu- 
sive, que expresa la creencia de que un evento ocurrirá. Un meteorólogo puede establecer que la pro- 
babilidad de que llueva mañana es de 0.20. El director de proyectos de una empresa que participa en 
una licitación para construir una estación del metro en Bangkok puede evaluar la probabilidad de que 
la empresa obtenga el contrato en 0.70. En este capítulo se estudiaron los métodos para combinar pro- 
babilidades utilizando las reglas de la adición y la multiplicación, se presentaron algunos principios de 
conteo y se describieron situaciones donde es posible utilizar el teorema de Bayes. 

En el capítulo 6 se exponen las distribuciones de probabilidad discreta. Las distribuciones de pro- 
babilidad son enumeraciones de los posibles resultados de un experimento y la probabilidad asociada 
con cada una. En este capítulo se describen tres distribuciones de probabilidad discreta: la distribución 
binomial, la distribución hipergeométrica y la distribución de Poisson. 

En el capítulo 7 se describen tres distribuciones de probabilidad continua: la distribución de pro- 
babilidad uniforme, la distribución de probabilidad normal y la distribución exponencial. 

La distribución uniforme tiene una configuración rectangular y se describe por sus valores mínimo 
y máximo. La media y mediana son iguales y no tienen moda. Una distribución de probabilidad normal 
se utiliza para describir fenómenos tales como el peso de los recién nacidos, el tiempo que toma 
ensamblar productos, o las puntuaciones que obtienen los estudiantes en un examen. En realidad, 
existe una familia de distribuciones normales, cada una con sus propias media y desviación estándar. 
Por ejemplo, existe una distribución normal con una media de 100 y una desviación estándar de 5; otra 
con una media de 149 y una desviación estándar de 5.26, etcétera. 

Una distribución de probabilidad normal es simétrica respecto de su media, y las colas de la curva 
normal se extienden indefinidamente en cualquier dirección. Como existe una cantidad ilimitada de dis- 
tribuciones normales, el número de tablas como la B.1 puede ser inmenso. En vez de usar una gran 
cantidad de tablas, puede convertirse en una distribución de probabilidad normal estándar al calcular 
los valores z. La distribución de probabilidad normal estándar tiene una media de 0 y una desviación 


Glosario 
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estándar de 1 . Resulta de utilidad porque la probabilidad de cualquier evento a partir de una distribu- 
ción de probabilidad normal puede calcularse mediante tablas de probabilidad normal estándar. 

La distribución exponencial describe el tiempo entre eventos que ocurren en secuencia. Estos 
eventos suceden independientemente a un ritmo constante por unidad o duración de tiempo. La dis- 
tribución de probabilidad exponencial tiene un sesgo positivo, con X como el parámetro de “ritmo”. La 
media y la desviación estándar son iguales y son recíprocas de X. Si la vida media de un televisor es 
de 8 años, entonces el ritmo anual de falla es 1/8 y la desviación estándar del ritmo de falla también 
es de 1 / 8 . 


Glosario 


Capítulo 5 

Evento Conjunto de uno o más resultados de un experimento. 
Por ejemplo, un evento consiste en el conjunto de números pares 
en el lanzamiento de un dado no cargado. 

Experimento Actividad que se observa o se mide. Por ejemplo, 
un experimento puede consistir en contar el número de respues- 
tas correctas a una pregunta. 

Fórmula de la multiplicación Una de las fórmulas para contar 
el número de posibles resultados de un experimento. Establece 
que si hay m formas de hacer algo y n formas de hacer otra cosa, 
hay m x n formas de hacer ambas. Por ejemplo: una tienda de 
artículos deportivos ofrece dos chaquetas deportivas y tres pan- 
talones deportivos combinados en $400. ¿Cuántos diferentes 
trajes completos se pueden ofrecer? La respuesta es m x n = 2 
x 3 = 6 . 

Fórmula de las combinaciones Fórmula para enumerar los 
posibles resultados. Si el orden a, b, c se considera el mismo que 
b, a, c, o c, b, a, etc., el número de disposiciones se determina 
mediante 


n r ri(n - r) i 

Fórmula de las permutaciones Fórmula para contar el núme- 
ro de posibles resultados. Si a, b, c es un arreglo, b, a, c otro, c, 
a, b otro, y así sucesivamente, el número total de arreglos se 
determina mediante la fórmula 


n r (n - i)l 

Independiente La incidencia de un evento no influye en la pro- 
babilidad de que ocurra otro evento. 

Mutuamente excluyente La ocurrencia de un evento significa 
que ninguno de los otros eventos puede ocurrir al mismo tiempo. 
Probabilidad Valor entre 0 y 1, inclusive, que indica la posibili- 
dad de que ocurra un evento. 

Probabilidad clásica Probabilidad basada en el supuesto de 
que cada uno de los resultados tiene la misma probabilidad. De 
acuerdo con este concepto de probabilidad, si hay n resultados 
posibles, la probabilidad de un resultado es de 1/n. Por lo tanto, 
cuando se lanza una moneda al aire, la probabilidad de que salga 
una cara es de 1 /n = 1 / 2 . 

Probabilidad condicional Posibilidad de que un evento ocurra 
dado que haya ocurrido ya otro evento. 

Probabilidad empírica Concepto probabilístico asentado en la 
experiencia previa. Por ejemplo, la compañía Metropolitan Life 
Insurance informó que, durante el año, 100.2 de cada 100 000 
personas del estado de Wyoming murieron por accidentes (acci- 
dentes automovilísticos, caídas, ahogados, por armas de fuego). 


A partir de esta experiencia, Metropolitan calcula la probabilidad 
de que ocurra una muerte accidental en el caso de un habitante 
de Wyoming: 100.2/100 000 = 0.001002. 

Probabilidad subjetiva Posibilidad de que suceda un evento 
con base en cualquier información disponible: presentimiento, 
opinión personal, opiniones de otros, rumores, etcétera. 

Regla especial de la adición Para que esta regla sea aplica- 
ble, los eventos deben ser mutuamente excluyentes. En el caso 
de dos eventos, la probabilidad de que ocurran A o 6 se deter- 
mina mediante la fórmula 

P(A o B) = P(A) + P(B) 

Por ejemplo: la probabilidad de que en el lanzamiento de un dado 
aparezca un punto o dos puntos. 



Regla especial de la multiplicación Si dos eventos no se 
encuentran relacionados —son independientes—, se aplica esta 
regla para determinar la probabilidad de que sucedan al mismo 
tiempo. 

P(A y B) = P(A)P(B) 

Por ejemplo: la probabilidad de que caigan dos caras en dos lan- 
zamientos de una moneda es: 

P(A y B) = P(A)P(B) = ^2 = 4 

Regla general de la adición Se utiliza para determinar las pro- 
babilidades de eventos complejos compuestos por A o B. 

P(A o B) = P(A ) + P(B) - P(A y B) 

Regla general de la multiplicación Se utiliza para determinar 
probabilidades de eventos A y B, los cuales se presentan al 
mismo tiempo. Por ejemplo: se sabe que hay 3 radios defectuo- 
sos en una caja que contiene 10 radios. ¿Cuál es la probabilidad 
de seleccionar 2 radios defectuosos en las primeras dos selec- 
ciones de la caja? 

P(A y B) = P(A)P(B |A) = ^x| = ^ = .067 

En este caso, P(B\A) es la probabilidad condicional, y significa la 
probabilidad de que B ocurra dado que ha ocurrido A. 
Resultado Observación o medición de un experimento. 
Teorema de Bayes Formulado por el reverendo Bayes en el 
siglo viii, está diseñado para determinar la probabilidad de que 
ocurra un evento A, dado que haya ocurrido otro evento B. 
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Capítulo 6 

Distribución de Poisson Distribución que se emplea con fre- 
cuencia para aproximar probabilidades binomiales cuando n es 
grande y tt pequeño. Qué se considera grande o pequeño, no se 
define con precisión, pero una regla general consiste en que n 
debe ser igual o mayor que 20, y tt, igual o menor que 0.05. 
Distribución de probabilidad Lista de posibles resultados 
de un experimento y la probabilidad asociada con cada uno de 
ellos. 

Distribución de probabilidad binomial Distribución de proba- 
bilidad con base en una variable aleatoria discreta. Sus principa- 
les características son: 

1 . Cada resultado se clasifica en una de dos categorías mutua- 
mente excluyentes. 

2. La distribución es el resultado de contar el número de éxi- 
tos. 

3. Cada prueba es independiente: la respuesta a la prueba 1 
(correcta o incorrecta) no influye en la respuesta a la prue- 
ba 2. 

4. La probabilidad de éxito es igual de una prueba a otra. 
Distribución de probabilidad hipergeométrica Distribución 
de probabilidad establecida en una variable aleatoria discreta. 
Sus principales características son: 

1. Hay una cantidad fija de pruebas. 

2. La probabilidad de éxito no es la misma de una prueba a 
otra. 

3. Sólo hay dos posibles resultados. 

Variable aleatoria Cantidad que se obtiene de un experimento 
que puede dar como resultado valores diferentes. Por ejemplo, 
la enumeración del número de accidentes (el experimento) en la 


carretera federal 75 en una semana puede ser de 10, 11, 12, o 
cualquier otro número. 

Variable aleatoria continua Variable aleatoria que adopta una 
infinidad de valores dentro de un intervalo. 

Variable aleatoria discreta Variable aleatoria que adopta sólo 
ciertos valores separados. 

Capítulo 7 

Distribución de probabilidad exponencial Una distribución 
de probabilidad continua con sesgo positivo, descrita por un solo 
parámetro de “ritmo” (X). Su probabilidad es X con un valor ini- 
cial de 0, y declina uniformemente mientras se extiende de 
manera indefinida hacia la izquierda o la derecha. Tanto la media 
como la desviación estándar son las recíprocas del parámetro de 
ritmo X. 

Distribución de probabilidad normal Distribución continua en 
forma de campana con una media que divide la distribución 
en dos partes iguales. Además, la curva normal se extiende inde- 
finidamente en cualquier dirección y jamás toca el eje X. La dis- 
tribución queda definida por su media y desviación estándar. 
Distribución de probabilidad uniforme Distribución de proba- 
bilidad continua de forma rectangular. Se le describe de forma 
completa con los valores mínimo y máximo de la distribución 
para calcular la media y la desviación estándar. Asimismo, los 
valores mínimo y máximo se utilizan para calcular la probabilidad 
de cualquier evento. 

Factor de corrección de continuidad Se utiliza para mejorar 
la exactitud de la aproximación de una distribución discreta por 
medio de una distribución continua. 

Valor z Distancia entre un valor seleccionado y la media pobla- 
cional medida en unidades de desviación estándar. 


Problemas 


1. Se dice que Proactine, un nuevo medicamento contra el acné, tiene 80% de eficacia: de cada 100 
personas que se lo aplican, 80 muestran progresos significativos. Se aplica en el área afectada en 
un grupo de 15 personas. ¿Cuál es la probabilidad de que: 

a) las 15 muestren mejoras significativas? 

b) menos de 9 muestren mejoras significativas? 

c) 12 o más personas muestren mejoras significativas? 

2. El First National Bank investiga a conciencia a las personas que solicitan créditos para realizar 
mejoras menores en sus viviendas. Su registro de retrasos en los pagos es impresionante: la pro- 
babilidad de que un propietario de vivienda no cumpla puntualmente con sus pagos es de apenas 
0.005. El banco aprobó 400 créditos para mejoras menores de vivienda. Si aplica una distribución 
de Poisson al problema: 

a) ¿Cuál es la probabilidad de que ninguno de ios 400 propietarios de vivienda se retrase en los 
pagos? 

b) ¿Cuántos de los 400 se espera que se retrasen? 

c) ¿Cuál es la probabilidad de que 3 o más propietarios de vivienda se retrasen en el pago de los 
créditos para mejoras menores de vivienda? 

3. Un estudio relacionado con la asistencia de aficionados a los partidos de basquetbol de la 
Universidad de Alabama reveló que la distribución de la asistencia es normal, con una media de 
10 000 y una desviación estándar de 2 000. 

a) ¿Cuál es la probabilidad de que un partido registre una asistencia de 13 500 o más especta- 
dores? 

b) ¿Qué porcentaje de partidos registra una asistencia de entre 8 000 y 1 1 500 aficionados? 

c) ¿Qué asistencia aproximada se registra en 10% de los partidos? 


Casos 
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4. La compañía de seguros Daniel-James asegurará una plataforma marítima de producción de Mobil 
Oil contra pérdidas ocasionadas por el clima durante un año. El presidente de la aseguradora 
calcula las siguientes pérdidas (en millones de dólares) con las probabilidades correspondientes. 


Monto de las pérdidas 
(millones de dólares) 

Probabilidad 
de pérdida 

0 

.98 

40 

.016 

300 

.004 


a) ¿Cuál es el monto esperado que deberá pagar Daniel-James a Mobil por concepto de deman- 
das? 

b) ¿Cuál es la probabilidad de que Daniel-James pierda menos del monto esperado? 

c) En caso de que Daniel-James sufra una pérdida, ¿cuál es la probabilidad de que sea de $300 
millones? 

d) Daniel-James fijó la prima anual en $2.0 millones. ¿Es una prima justa? ¿Cubrirá su riesgo? 

5. La distribución de la cantidad de niños de edad escolar por familia en el área de Whitehall Estafes, 
de Boise, Idaho, es la siguiente: 


Número de niños 0 12 3 4 

Porcentaje de familias 40 30 15 10 5 


a) Determine la media y la desviación estándar del número de niños en edad escolar por familia 
en la región de Whitehall Estafes. 

b) Se planea una nueva escuela en la región de Whitehall Estafes. Es necesario realizar un cálculo 
del número de niños en edad escolar. Hay 500 unidades familiares. ¿Cuántos niños calcularía 
que hay? 

c) Se necesita información adicional de las familias que tienen niños exclusivamente. Convierta la 
información anterior de familias con niños. ¿Cuál es la media del número de niños en las fami- 
lias con niños? 

6. En la siguiente tabla se desglosan los miembros del 110o. Congreso de Estados Unidos por afilia- 
ción política. 



Partido 

Demócratas Republicanos 

Total 

Cámara 

236 

199 

435 

Senado 

48 

52 

100 

Total 

284 

251 

535 


a) Se elige al azar a un miembro del Congreso. ¿Cuál es la probabilidad de elegir a un republi- 
cano? 

b) Si la persona elegida es miembro de la Cámara de Representantes, ¿cuál es la probabilidad de 
que sea un republicano? 

c) ¿Cuál es la probabilidad de elegir a un miembro de la Cámara de Representantes o a un demó- 
crata? 


Casos 


A. Century Nacional Bank 

Consulte los datos relativos a Century National Bank. ¿Es razo- 
nable que la distribución para verificar los saldos de las cuentas 
se aproxime a una distribución de probabilidad normal? De- 
termine la media y la desviación estándar de una muestra de 60 
clientes. Compare la distribución real con la teórica. Mencione 
algunos ejemplos específicos y haga comentarios sobre sus con- 
clusiones. 


Divida los saldos de las cuentas en tres grupos de 20 cada 
uno, y coloque la tercera parte más pequeña en el primer grupo; 
la tercera parte de en medio en el segundo grupo y las que tie- 
nen el saldo más considerable en el tercer grupo. Luego, elabo- 
re una tabla que contenga el número de cada una de las catego- 
rías de los saldos de las cuentas por sucursal. ¿Parece que las 
cuentas se relacionan con la sucursal correspondiente? Cite 
ejemplos o haga comentarios sobre sus conclusiones. 


262 
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B. Auditor de elecciones 

Un tema como el del incremento de los impuestos, la revocación 
de funcionarios electos o la expansión de los servicios públicos 
pueden someterse a un referéndum si se recaban suficientes fir- 
mas válidas para apoyar la petición. Desafortunadamente, mu- 
chas personas firmarán la petición aunque no estén registradas 
en el distrito correspondiente, o firmarán la petición más de una 
vez. 

Sara Ferguson, auditora de elecciones del condado de Ve- 
nango, tiene que certificar la validez de las firmas antes de que 
se presente la petición de manera oficial. No es de sorprender 
que su personal se encuentre agobiado de trabajo; así, ella pien- 
sa aplicar métodos estadísticos para dar validez a los documen- 
tos, los cuales contienen 200 firmas, en lugar de dar validez a 
cada una de las firmas. En una reunión profesional reciente, des- 
cubrió que, en algunas comunidades del estado, los funcionarios 
electorales verificaban apenas cinco firmas de cada página y 
rechazaban toda la página en caso de que dos o más fueran 
inválidas. Algunas personas piensan que cinco firmas pueden no 
ser suficientes para tomar una buena decisión. Sugieren que 
usted verifique 10 firmas y rechace la página si tres o más son 
inválidas. 

Con el fin de investigar estos métodos, Sara pide a su per- 
sonal que extraiga los resultados de la última elección y tome una 
muestra de 30 páginas. Sucede que ei personal escogió 14 pági- 
nas del distrito de Avondale, 9 del distrito de Midway y 7 de 
Kingston. Cada página contenía 200 firmas; los datos que apare- 
cen a continuación muestran el número de firmas invalidadas en 
cada página. 

Utilice ios datos para evaluar las dos propuestas de Sara. 
Calcule la probabilidad de rechazar una página de acuerdo con 
los dos enfoques. ¿Obtendría aproximadamente los mismos re- 
sultados si analizara cada firma? Proponga su propio plan y 
explique por qué podría ser mejor o peor que los dos planes pro- 
puestos por Sara. 


Avondale 

Midway 

Kingston 

9 

19 

38 

14 

22 

39 

11 

23 

41 

8 

14 

39 

14 

22 

41 

6 

17 

39 

10 

15 

39 

13 

20 


8 

18 


8 



9 



12 



7 



13 




C. Geoff “aplica” su educación 

Geoff Brown es gerente de una pequeña empresa de telemarke- 
ting y evalúa la tasa de ventas de sus empleados con experien- 
cia para establecer niveles mínimos con el fin de hacer nuevas 
contrataciones. Durante las últimas semanas registró el número 
de llamadas exitosas por hora del personal. Estos datos, que se 
presentan a continuación, incluyen estadísticas resumidas que 
formuló con ayuda de un software de estadística. Geoff estudió 
en la universidad de la comunidad y ha oído sobre los distintos 
tipos de distribuciones de probabilidad (binomial, normal, hiper- 


geométrica, de Poisson, etc.) ¿Puede dar algunos consejos a 
Geoff sobre el tipo de distribución que debe emplear para adap- 
tarse a estos datos lo mejor posible y decidir cuándo aceptar a 
un empleado que está a prueba, una vez que alcanza el mayor 
grado de productividad? Es importante, pues implica un incre- 
mento salarial para el empleado y, en el pasado, algunos traba- 
jadores a prueba abandonaron el empleo debido a que se des- 
alentaron porque no cumplieron con los requisitos. 

Las llamadas de ventas exitosas por hora durante la sema- 
na del 14 de agosto son las siguientes: 

1 

4231 45523224525330 

13284522415545124 


Estadística descriptiva: 


N 

MEDIA 

MEDIANA 

MDIATR 

DESSTD 

MEDIASE 

35 

3.229 

3.000 

3.194 

1.682 

0.284 

MÍN 

MÁX 

Q1 

Q3 



0.0 

8.000 

2.000 

5.000 




¿Qué distribución piensa que Geoff debe utilizar para su análisis? 

D. Tarjeta de crédito del banco CNP 

Por lo general, antes de que un banco emita una tarjeta de cré- 
dito clasifica o califica al cliente en función de la probabilidad de 
que resulte rentable. Una tabla habitual de calificaciones es la 
siguiente: 


Edad 

Menos de 25 

(12 pts.) 

25-29 

(5 pts.) 

30-34 

(0 pts.) 

35+ 

(18 pts.) 

Tiempo 

<1 año 

1 -2 años 

3-4 años 

5+ años 

Viviendo en la 

misma dirección 

(9 pts.) 

(0 pts.) 

(13 pts.) 

(20 pts.) 

Antigüedad 

Ninguna 

0-1 año 

2-4 años 

5+ años 

con automóvil 

(18 pts.) 

(12 pts.) 

(13 pts.) 

(3 pts.) 

Pago 

Ninguno 

$1 -$99 

$1 00-$299 

$300+ 

mensual del 
automóvil 

(15 pts.) 

(6 pts.) 

(4 pts.) 

(0 pts.) 

Costo de 

$1 -$1 99 

$200-$399 

Propia 

Vive con 

vivienda 

(0 pts.) 

(10 pts.) 

(12 pts.) 

parientes 

(24 pts.) 

Cuenta de 
cheques 

Ambas 

Sólo 

cheques 

Sólo 

ahorros 

Ninguna 

o ahorros 

(15 pts.) 

(3 pts.) 

(2 pts.) 

(0 pts.) 


La calificación es la suma de los puntos de los seis rubros. Por 
ejemplo, Sushi Brown tiene menos de 25 años (12 puntos); ha 
vivido en el mismo domicilio durante dos años (0 puntos); desde 
hace cuatro años es dueño de un automóvil (13 puntos), por el 
que realiza pagos de $75 (6 puntos); realiza gastos domésticos 
de $200 (10 puntos) y posee una cuenta de cheques (3 puntos). 
La calificación que obtendría sería de 44. 

Después, con una segunda tabla, se convierten las califica- 
ciones en probabilidades de rentabilidad del cliente. A continua- 
ción aparece una tabla de esta clase. 


Puntuación 

30 

40 

50 

60 

70 

80 

90 

Probabilidad 

.70 

.78 

.85 

.90 

.94 

.95 

.96 


Test de práctica 
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La puntuación de Sushi (44) se traduciría en una probabilidad de 
rentabilidad aproximada de 0.81 . En otras palabras, 81 % de los 
clientes como Sushi generarían dinero a las operaciones con tar- 
jeta del banco. 

A continuación se muestran los resultados de las entrevistas 
con los tres posibles clientes. 



David 

Edward 

Ann 

Nombre 

Born 

Brendan 

McLaughlin 

Edad 

42 

23 

33 

Tiempo de vivir 
en el mismo domicilio 

9 

2 

5 

Antigüedad con el auto 

2 

3 

7 

Pago mensual del auto 

$140 

$99 

$175 

Costo de vivienda 

$300 

$200 

Propietaria 

Cuenta de cheques o ahorros 

Ambas 

Sólo de cheques 

Ninguna 


1 . Califique a cada uno de estos clientes y calcule la probabilidad 
de que resulten rentables. 

2. ¿Cuál es la probabilidad de que los tres resulten rentables? 

3. ¿Cuál es la probabilidad de que ninguno sea rentable? 

4. Determine la distribución de probabilidad total del número de 
clientes rentables entre este grupo de tres clientes. 

5. Redacte un breve resumen de sus hallazgos. 


Test de práctica 


Parte 1 : Objetivo 

1. ¿Bajo qué condiciones una probabilidad sería mayor a 1 o 100%? 1. 

2. Un es la observación de alguna actividad o el acto de tomar algún tipo de medida. 

2 

3. Un es la recolección de uno o más resultados de un experimento. 3 

4. Una probabilidad es la posibilidad de que dos o más eventos ocurrirán al mismo tiempo. 

4 

5. En una (5a) el orden en que se cuentan los eventos es importante, pero en una (56) no es importante. 

5. a) 

5. b) 

6. En una distribución de probabilidad discreta, la suma de los posibles resultados es igual a 

6 

7. ¿Cuál de los siguientes NO es un requisito para la distribución binomial? (Probabilidad constante de éxito, tres o más resulta- 
dos, el resultado de los conteos.) 7. 

8. ¿Cuántas distribuciones normales existen? (Elija una: 1, 10, 30, 1 000, o infinitas.) 8 

9. ¿Cuántas distribuciones estándar existen? (Elija una: 1, 10, 30, 1 000, o infinitas.) 9 

10. ¿Cuál es la probabilidad de encontrar un valor z entre 0 y -0.76? 10 

11. ¿Cuál es la probabilidad de encontrar un valor z mayor a 1 .67? 11 

12. Dos eventos son si la ocurrencia de uno de ellos no afecta la ocurrencia del otro. 

12 

13. Dos eventos son si por virtud de que ocurra uno, el otro no puede ocurrir. 13 

14. ¿Cuál de los siguientes conceptos es falso con respecto a la distribución de probabilidad normal.) (Asintótico, familia de distri- 
buciones, sólo dos resultados, 50% de las observaciones son mayores que la media.) 14 

15. ¿Cuál de los siguientes conceptos describe mejor la forma de una distribución de probabilidad normal? (Forma de campana, 

uniforme, forma de V, no hay forma constante.) 15 


Parte 2: Problemas 

1. El contador Fred Friendly tiene que preparar 20 declaraciones de impuestos antes de la fecha límite del 15 de abril. Ya es tarde 
en la noche, así que decide hacer dos más antes de irse a casa. En su paquete de cuentas, 12 son personales, 5 comerciales y 
3 pertenecen a organizaciones de caridad. Si selecciona dos al azar, ¿cuál es la probabilidad de que: 

a) ambas sean comerciales? 

b) al menos una sea comercial? 

2. El IRS reporta que 15% de las declaraciones donde el ingreso bruto ajustado asciende a más de un millón de dólares estarán 
sujetas a una auditoría por computadora. Durante el ejercicio de 2008, el contador Fred Friendly completó 16 declaraciones 
donde el ingreso bruto ajustado era de más de un millón de dólares. 

a) ¿Cuál es la probabilidad de que exactamente una de estas declaraciones será auditada? 

b) ¿Cuál es la probabilidad de que al menos una sea auditada? 

3. Fred trabaja en un despacho fiscal junto con otros cinco contadores. Flay cinco lugares de estacionamiento a un lado de la ofi- 
cina. ¿En cuántas formas diferentes pueden ser dispuestos los autos de los contadores en los cinco lugares? Asuma que todos 
usan su auto para ir a trabajar. 
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4. Fred decidió estudiar el número de exenciones reclamadas en las declaraciones personales de impuestos que preparó en 2007. 
Los datos se resumen en la siguiente tabla: 


Exenciones 

Porcentaje 

1 

20 

2 

50 

3 

20 

4 

10 


a) ¿Cuál es el número medio de exenciones por declaración? 

b) ¿Cuál es la varianza del número de exenciones por declaración? 

5. En un memorándum a todos los involucrados en la preparación de las declaraciones de impuestos, el IRS indicó que la canti- 
dad media de reembolsos fue $1 600, con una desviación estándar de $850. Asuma que la distribución de las cantidades devuel- 
tas sigue una distribución normal. 

a) ¿Qué porcentaje de las devoluciones estuvo entre $1 600 y $2 000? 

b) ¿Qué porcentaje de las devoluciones estuvo entre $900 y $2 000? 

c) De acuerdo con la información anterior, ¿qué porcentaje de las devoluciones fue de menos de $0? Es decir, el contribuyente 
aún le debe al IRS. 

6. Durante el ejercicio de 2008, Fred Friendly completó un total de 80 declaraciones. Desarrolló la siguiente tabla que resume la 
relación entre el número de dependientes económicos y el hecho de que el cliente recibiera o no una devolución. 


Devolución 


Dependientes 

Total 

1 

2 

3 o más 

Sí 

20 

20 

10 

50 

No 

10 

20 

0 

30 

Total 

30 

40 

10 

80 


a) ¿Qué nombre recibe esta tabla? 

b) ¿Cuál es la probabilidad de seleccionar un cliente que recibió una devolución? 

c) ¿Cuál es la probabilidad de seleccionar un cliente que recibió una devolución o tenía un dependiente? 

d) Dado que el cliente recibió una devolución, ¿cuál es la probabilidad de que tuviera un dependiente? 

e) ¿Cuál es la probabilidad de seleccionar un cliente que no recibió devolución y tenía un dependiente? 

7. El IRS permite a los contribuyentes elegir que el IRS calcule la cantidad de la devolución de sus impuestos. Durante una época 

muy ocupada, el número de declaraciones que recibió el Centro de Servicio Springfield, que solicitó este servicio, sigue una dis- 

tribución de Poisson con una media de tres por día. ¿Cuál es la probabilidad de que en un día en particular: 

a) no haya solicitudes? 

b) aparezcan exactamente tres solicitudes? 

c) se efectúen cinco o más solicitudes? 

d) no haya solicitudes en dos días consecutivos? 



} 

Métodos de muestreo 
y teorema central 
del límite 



El informe anual de Nike indica que el estadounidense promedio 
compra 6.5 pares de zapatos deportivos al año. Suponga que la 
desviación estándar de la población es de 2.1 y que se analizará una 
muestra de 81 clientes el siguiente año. ¿Cuál es el error estándar de 
la media en este experimento? (Vea el objetivo 5 y el ejercicio 45.) 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Explicar la razón por 
qué, con frecuencia, una 
muestra es la única forma 
viable para conocer algo sobre 
una población. 

OA2 Describir métodos para 
seleccionar una muestra. 

OA3 Definir un error de 
muestreo. 

OA4 Definir y construir una 
distribución muestral de la 
media de la muestra. 

OA5 Comprender y explicar 
el teorema central del límite. 

OA6 Definir el error estándar 
de la media. 

OA7 Aplicar el teorema 
central del límite para calcular 
probabilidades de seleccionar 
posibles medias muéstrales de 
una población específica. 
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Estadística en acción 

Con el importante papel 
que desempeña la esta- 
dística inferencial en 
todas las ramas de la 
ciencia, es ya una necesi- 
dad disponer de fuentes 
copiosas de números alea- 
torios. En 1927 se publi- 
có el primer libro de 
números aleatorios, con 
41 600 dígitos, generados 
por L. Tippett. En 1938, 
R.A. Fisher y E. Yates 
publicaron 15 000 dígitos 
aleatorios, generados con 
dos barajas. En 1955, 
RAND Corporation 
publicó un millón de 
dígitos aleatorios, genera- 
dos por pulsos de fre- 
cuencia aleatorios de una 
ruleta electrónica. En 
1970, las aplicaciones del 
muestreo requerían miles 
de millones de números 
aleatorios. Desde enton- 
ces se han creado méto- 
dos para generar, con 
ayuda de computadoras, 
dígitos “casi” aleatorios, 
por lo que se les llama 
pseudoaleatorios. Aún es 
motivo de debate la pre- 
gunta acerca de si un pro- 
grama de computadora 
sirve para generar núme- 
ros aleatorios que de ver- 
dad lo sean. 



8.1 Introducción 

En los capítulos 2 a 4 se hizo hincapié en las técnicas para describir datos. Con el fin de ¡lus- 
trar dichas técnicas, se organizaron las ganancias sobre 1 80 vehículos que el mes pasado ven- 
dió Applewood Auto Group en una distribución de frecuencias para calcular las diversas medi- 
das de ubicación y dispersión. Dichas medidas, como la media y la desviación estándar, des- 
criben el precio de venta habitual y la dispersión de las ganancias. En esos capítulos se des- 
tacó la descripción de la condición de los datos: se describió algo que ya había sucedido. 

En el capítulo 5 se comienza a establecer el fundamento de la inferencia estadística con 
el estudio de la probabilidad. Recuerde que, en la inferencia estadística, el objetivo es deter- 
minar algo sobre una población a partir sólo de una muestra. La población es todo el grupo de 
individuos u objetos en estudio, y la muestra es una parte o subconjunto de dicha población. 
El capítulo 6 amplía los conceptos de probabilidad al describir tres distribuciones de probabi- 
lidad discreta: binomial, hipergeométrica y de Poisson. En el capítulo 7 se describen tres dis- 
tribuciones de probabilidad continua: la uniforme, la normal y la exponencial. Las distribucio- 
nes de probabilidad abarcan todos los posibles resultados de un experimento, así como la 
probabilidad asociada con cada resultado. Mediante las distribuciones de probabilidad se eva- 
luó la posibilidad de que algo ocurra en el futuro. 

En este capítulo comienza el estudio del muestreo, herramienta para inferir algo sobre una 
población. Primero se analizan los métodos para seleccionar una muestra de una población. 
Después se construye una distribución de la media de la muestra para entender la forma en 
que las medias muéstrales tienden a acumularse en torno a la media de la población. Por últi- 
mo, se demuestra que, para cualquier población, la forma de esta distribución de muestreo 
tiende a seguir la distribución de probabilidad normal. 


8.2 Métodos de muestreo 

Ya se mencionó en el capítulo 1 que el propósito de la estadística Inferencial consiste en deter- 
minar algo sobre una población a partir de una muestra. Una muestra es una porción o parte 
de la población de interés. En muchos casos, el muestreo resulta más accesible que el estu- 
dio de toda la población. En esta sección se explican las razones principales para muestrear 
y, en seguida, diversos métodos para elegir una muestra. 


Razones para muestrear 

Cuando se estudian las características de una población, existen diversas razones prácticas 
para preferir algunas partes o muestras de ella para observar y medir. He aquí algunas razo- 
nes para muestrear: 

1. Establecer contacto con toda la población requeriría mucho tiempo. Un candidato 
para un puesto federal quizá desee determinar las posibilidades que tiene de resultar ele- 
gido. Una encuesta de muestreo en la que se utiliza el personal y las entrevistas de campo 
convencionales de una empresa especializada en encuestas tardaría de uno a dos días. 
Con el mismo personal y los mismos entrevistadores, y laborando siete días a la semana, 
se requerirían 200 años para ponerse en contacto con toda la población en edad de votar. 
Aunque fuera posible reunir a un numeroso equipo de encuestadores, quizá no valdría la 
pena entrar en contacto con todos los votantes. 

2. El costo de estudiar todos los elementos de una población resultaría prohibitivo. Por 
lo general, las organizaciones que realizan encuestas de opinión pública y pruebas entre 
consumidores, como Harris International, CBS News Polis y Zogby International, entran 
en contacto con menos de 2 000 de las casi 60 millones de familias en Estados Unidos. 
Una organización que entrevista a consumidores en panel cobra cerca de $40 000 
por enviar muestras por correo y tabular las respuestas con el fin de probar un pro- 
ducto (como un cereal para el desayuno, alimento para gato o algún perfume). La misma 
prueba del producto con las 60 millones de familias tendría un costo de alrededor de 
$1 000 000 000 . 
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OA1 Explicar la razón por 
qué, con frecuencia, una 
muestra es la única forma 
viable para conocer algo 
sobre una población. 


3. Es imposible verificar de manera física todos los elementos de la población. Algunas 
poblaciones son infinitas. Sería imposible verificar toda el agua del lago Erie en lo que se 
refiere a niveles de bacterias, así que se eligen muestras en diversos lugares de él. Las 
poblaciones de peces, aves, serpientes o mosquitos son grandes, y se desplazan, nacen 
y mueren de manera continua. En lugar de intentar contar todos los patos que hay en 
Canadá o todos los peces del lago Pontchartraln, se hacen aproximaciones mediante 
diversas técnicas: se cuentan todos los patos que hay en un estanque, capturados al azar, 
se revisan las cestas de los cazadores o se colocan redes en lugares predeterminados en 
el lago. 


Algunas pruebas son de naturaleza destructiva. Si los catadores de 
vino de Sutter Home Wlnery, California, se bebieran todo el vino para eva- 
luar la vendimia, acabarían con la cosecha y no quedaría nada disponible 
para la venta. En el área de producción industrial: las placas de acero, 
cables y productos similares deben contar con una resistencia mínima a 
la tensión. Para cerciorarse de que el producto satisface la norma mínima, 
el departamento de control de calidad elige una muestra de la producción. 
Cada pieza se somete a tensión hasta que se rompe y se registra el punto 
de ruptura (medido en libras por pulgada cuadrada). Es obvio que si se 
sometieran todos los cables o todas las placas a pruebas de resistencia 
a la tensión no habría productos disponibles para vender o utilizar. Por la 
misma razón, sólo unas cuantas semillas se someten a pruebas de germi- 
nación en Burpee Seeds, Inc., antes de la temporada de siembra. 

5. Los resultados de la muestra son adecuados. Aunque se contara con recursos sufi- 
cientes, es difícil que la precisión de una muestra de 100% —toda la población— resulte 
esencial en la mayoría de los casos. Por ejemplo, el gobierno federal utiliza una muestra 
de tiendas de comestibles distribuidas en Estados Unidos para determinar el índice men- 
sual de precios de los alimentos. Los precios del pan, frijol, leche y otros productos de pri- 
mera necesidad se incluyen en el índice. Resulta poco probable que la inclusión de todas 
las tiendas de comestibles de Estados Unidos influya significativamente en el índice, pues 
los precios de la leche, el pan y otros productos de primera necesidad no varían más de 
unos cuantos centavos de una cadena de tiendas a otra. 



Muestreo aleatorio simple 

El tipo de muestreo más común es el muestreo aleatorio simple. 


OA2 Describir métodos para 
seleccionar una muestra. 


MUESTREO ALEATORIO SIMPLE Muestra seleccionada de manera que cada elemento o indivi- 
duo de la población tenga las mismas posibilidades de que se le incluya. 


Una tabla de números aleato- 
rios es una forma eficiente de 
seleccionar a los miembros 
de una muestra. 


Para ejemplificar el muestreo aleatorio simple y la selección, suponga que una población 
consta de 845 empleados de Nitra Industries, de la cual se va a elegir una muestra de 52 
empleados. Una forma de asegurarse de que todos los empleados de la población tienen las 
mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada 
empleado en un papel y depositarlos todos en una caja. Después de mezclar todos los pape- 
les, se efectúa la primera selección tomando uno de la caja sin mirarlo. Se repite este proce- 
so hasta terminar de elegir la muestra de 52 empleados. 

Un método más conveniente de seleccionar una muestra aleatoria consiste en utilizar un 
número de identificación por cada empleado y una tabla de números aleatorios como la del 
apéndice B.6. Como su nombre lo indica, estos números se generaron mediante un proceso 
aleatorio (en este caso, con una computadora). La probabilidad de 0, 1, 2, ..., 9 es la misma 
para cada dígito de un número. Por consiguiente, la probabilidad de que se seleccione al 
empleado 011 es la misma que tienen los empleados 722 o 382. Cuando se emplean núme- 
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Estadística en acción 

¿Es discriminación sacar 
ventaja del físico? Antes 
de contestar, considere 
un artículo reciente que 
apareció en Personnel 
Journal. Estos hallazgos 
indican que los hombres 
y mujeres atractivos 
ganan alrededor de 5% 
más que los que tienen 
una apariencia prome- 
dio, quienes, a su vez, 
ganan 5% más que sus 
compañeros poco agra- 
ciados. Esta preferencia 
afecta tanto a hombres 
como a mujeres. 
También es cierto en el 
caso de gran variedad de 
ocupaciones, desde la 
construcción hasta la 
reparación de automóvi- 
les y los empleos de tele- 
nrarketing, empleos para 
los que, según se cree, la 
apariencia no es impor- 
tante. 


ros aleatorios para seleccionar empleados, se elimina la influencia o sesgo del proceso de 
selección. 

En la siguiente ilustración aparece parte de una tabla de números aleatorios. Para selec- 
cionar una muestra de empleados, elija primero un punto de partida en la tabla; cualquier 
punto sirve. Ahora suponga que el reloj marca las 3:04. Puede observar la tercera columna y 
en seguida desplazarse hacia abajo hasta el cuarto conjunto de números. El número es 03759. 
Como sólo hay 845 empleados, utilizará los tres primeros dígitos de un número aleatorio de 
cinco dígitos. Por lo tanto, 037 es el número del primer empleado que se convertirá en miem- 
bro de la muestra. Otra forma de elegir el punto de partida consiste en cerrar los ojos y seña- 
lar un número de la tabla. Para continuar, puede desplazarse en cualquier sentido. Supon- 
ga que lo hace hacia la derecha. Los primeros tres dígitos del número a la derecha de 03759 
son 447, el número del siguiente empleado seleccionado para Integrar la muestra. El siguien- 
te número de tres dígitos a la derecha es 961. Omita 961, pues sólo hay 845 emplea- 
dos. Continúe hacia la derecha y seleccione al empleado 784; después el 189 y así en lo suce- 
sivo. 


5 0 5 2 5 

5 7 4 5 4 


2 8 4 5 5 


6 8 2 2 6 

3 4 6 5 6 


3 8 8 8 4 


3 9 0 1 8 

7 2 5 0 7 

5 3 3 8 0 


5 3 8 2 7 


4 2 4 8 6 

5 4 4 6 5 


7 18 19 


9 119 9 

3 4 9 8 6 

7 4 2 9 7 


0 0 14 4 


3 8 6 7 6 

8 9 9 6 7 


9 8 8 6 9 


3 9 7 4 4 

6 8 8 5 1 

2 7 3 0 5 


0 3 7 5 9 


4 4 7 2 3 

9 6 10 8 


7 8 4 8 9 


18 9 10 

0 6 7 3 8 

6 2 8 7 9 


0 3 9 1 0 


1 7 3 5 0 

4 9 16 9 


0 3 8 5 0 


18 9 10 

114 4 8 

1 0 7 3 4 


0 5 8 3 7 


2 4 3 9 7 

1 0 4 2 0 


16 7 12 


9 4 4 9 6 



Punto 

Segundo 


Tercer 

Cuarto 



de partida 

empleado 


empleado 

empleado 


La mayoría de los paquetes de software contienen una rutina para seleccionar una mues- 
tra aleatoria simple. En el siguiente ejemplo se emplea el sistema Excel para elegir una muestra 
aleatoria. 


Cjemplo 


Jane y Joe Millar administran el Foxtrot Inn, una pensión donde dan alojamiento y desayuno, 
localizada en Tryon, Carolina del Norte. El negocio tiene ocho habitaciones. A continuación 
aparece el número de estas ocho habitaciones rentadas diariamente durante junio de 201 1 . 
Utilice Excel para seleccionar una muestra de cinco noches de junio. 



Junio 

Habitaciones 
en renta 

Junio 

Habitaciones 
en renta 

Junio 

Habitaciones 
en renta 

1 

0 

11 

3 

21 

3 

2 

2 

12 

4 

22 

2 

3 

3 

13 

4 

23 

3 

4 

2 

14 

4 

24 

6 

5 

3 

15 

7 

25 

0 

6 

4 

16 

0 

26 

4 

7 

2 

17 

5 

27 

1 

8 

3 

18 

3 

28 

1 

9 

4 

19 

6 

29 

3 

10 

7 

20 

2 

30 

3 


Excel seleccionará la muestra aleatoria y arrojará los resultados. En la primera fecha que se 
muestreó había cuatro habitaciones rentadas. En la segunda fecha muestreada de junio, se ren- 
taron siete habitaciones. La información aparece en la columna D de la hoja de cálculo de 


Solución 
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Excel. Los pasos en Excel se incluyen en la sección Comandos de software, al final del capí- 
tulo. El sistema Excel lleva a cabo el muestreo con reemplazo. Esto significa que tal vez el 
mismo día aparezca más de una vez en una muestra. 


. 

Jum l one sample 



ABC 

0 E 

1 

Jun# RvoUlf 


2 

1 0 

4 

3 

2 2 

7 

4 

3 3 

4 

3 

4 2 

3 

6 

7 

3 3 

8 4 

1 

8 7 2 

9 8 3 

10 9 4 

a 

10 7 


12 

11 3 


13 

12 4 


14 

13 4 


15 

14 4 



Autoevaluación 8-1 



La siguiente lista incluye a los estudiantes que se matricularon en un curso de introducción a la 
estadística administrativa. Se eligen al azar tres estudiantes, a quienes se formulan varias preguntas 
relacionadas con el contenido del curso y el método de enseñanza. 

a) Se escriben a mano los números 00 a 45 en papeletas y se colocan en un recipiente. Los tres 
números seleccionados son 31, 7 y 25. ¿Qué estudiantes se van a incluir en la muestra? 

b) Ahora utilice la tabla de dígitos aleatorios, apéndice B.6, para seleccionar su propia muestra. 

c) ¿Qué haría si localizara el número 59 en la tabla de números aleatorios? 



CSPM 264 

01 BUSINESS 

& ECONOMIC STAT 



8:00 AM 

9:40 AM MW 

ST 118 

LIND D 


RANDOM 


CLASS 

RANDOM 


CLASS 

NUMBER 

ÑAME 

RANK 

NUMBER 

ÑAME 

RANK 

00 

ANDERSON, RAYMOND 

SO 

23 

MEDLEY, CHERYL ANN 

SO 

01 

ANGER, CHERYL RENEE 

SO 

24 

MITCHELL, GREG R 

FR 

02 

BALL, CLAIRE JEANETTE 

FR 

25 

MOLTER, KRISTI MARIE 

SO 

03 

BERRY, CHRISTOPHER G 

FR 

26 

MULCAHY, STEPHEN ROBERT 

so 

04 

BOBAK , JAMES PATRICK 

SO 

27 

NI CHOLAS, ROBERT CHARLES 

JR 

05 

BRIGHT, M. STARR 

JR 

28 

NICKENS, VIRGINIA 

SO 

0G 

CHONTOS , PAUL JOSEPH 

SO 

29 

PENNYWITT, SEAN PATRICK 

so 

07 

DETLEY, BRIAN HANS 

JR 

30 

POTEAU, KRIS E 

JR 

08 

DUDAS , VIOLA 

SO 

31 

PRICE , MARY LYNETTE 

SO 

09 

DULBS , RICHARD ZALFA 

JR 

32 

RISTAS, JAMES 

SR 

10 

EDINGER, SUSAN KEE 

SR 

33 

SAGER, ANNE MARIE 

so 

11 

FINK, FRANK JAMES 

SR 

34 

SMILLIE, HEATHER MICHELLE 

so 

12 

FRANCIS , JAMES P 

JR 

35 

SNYDER , LEI SHA KAY 

SR 

13 

GAGHEN , PAMELA LYNN 

JR 

36 

STAHL , MARIA TASHERY 

SO 

14 

GOULD , ROBYN KAY 

SO 

37 

ST. JOHN, AMY J 

so 

15 

GROSENBACHER , SCOTT ALAN 

SO 

38 

STURDEVANT , RICHARD K 

so 

16 

HEETFIELD, DIANE MARIE 

SO 

39 

SWETYE , LYNN MI CHELE 

so 

17 

KABAT, JAMES DAVID 

JR 

40 

WALASINSKI, MICHAEL 

so 

18 

KEMP, LISA ADRIANE 

FR 

41 

WALKER , DIANE ELAINE 

so 

19 

KILLION, MICHELLE A 

SO 

42 

WARNOCK, JENNIFER MARY 

so 

20 

KOPERSKI , MARY ELLEN 

SO 

43 

WILLIAMS, WENDY A 

so 

21 

KOPP , BRIDGETTE ANN 

SO 

44 

YAP , HOCK BAN 

so 

22 

LEHMANN, KRISTINA MARIE 

JR 

45 

YODER, ARLAN JAY 

JR 
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Muestreo aleatorio sistemático 

En algunos estudios, el procedimiento de muestreo aleatorio simple resulta complicado. Por 
ejemplo, suponga que la división de ventas de Computer Graphic, Inc., necesita calcular rápi- 
damente el ingreso medio en dólares por venta del mes pasado. La división confirmó que se 
registraron 2 000 ventas y se almacenaron en cajones de archivo, y se decidió seleccionar 100 
recibos para calcular el ingreso medio en dólares. El muestreo aleatorio simple requiere la 
numeración de cada recibo antes de utilizar la tabla de números aleatorios para seleccionar 
los 100 recibos. Dicho proceso de numeración puede tardar mucho tiempo. En su lugar, es 
posible aplicar el muestreo aleatorio sistemático. 



Estadística en acción 

Los métodos de muestreo 
aleatorio y sin sesgos son 
muy importantes para 
realizar inferencias esta- 
dísticas válidas. En 1936 
se efectuó un sondeo de 
opinión para predecir el 
resultado de la carrera 
presidencial entre 
Franklin Roosevelt y 
Alfred Landon. Se envia- 
ron diez millones de 
papeletas en forma de 
postales retornables gra- 
tuitas a domicilios toma- 
dos de directorios telefó- 
nicos y registros de auto- 
móviles. Se contestó una 
alta proporción de pape- 
letas, con 59% en favor 
de Landon y 41% de 
Roosevelt. El día de la 
elección, Roosevelt ganó 
con 61% de los votos. 
Landon obtuvo 39%. Sin 
duda, a mediados de la 
década de 1930, la gente 
que tenía teléfono y auto- 
móvil no era representati- 
va de los votantes esta- 
dounidenses. 



MUESTREO ALEATORIO SISTEMÁTICO Se selecciona un punto aleatorio de inicio y posteriormen- 
te se elige cada fc-ésimo miembro de la población. 


Primero se calcula k, que es el resultado de dividir el tamaño de la población entre el tama- 
ño de la muestra. En el caso de Computers Graphic, Inc., seleccione cada vigésimo recibo 
(2 000/100) de los cajones del archivo; al hacerlo evita el proceso de numeración. Si k no es 
un número entero, hay que redondearlo. 

Para seleccionar el primer recibo emplee el muestreo aleatorio simple. Por ejemplo, selec- 
cione un número de la tabla de números aleatorios entre 1 y k, en este caso, 20. Suponga que 
el número aleatorio resultó ser 18. Entonces, a partir del recibo 18, se seleccionará cada vigé- 
simo recibo (18, 38, 58, etc.) como muestra. 

Antes de aplicar el muestreo aleatorio sistemático, debe observar con cuidado el orden 
físico de la población. Cuando el orden físico se relaciona con la característica de la población, 
no debe aplicar el muestreo aleatorio sistemático. Por ejemplo, si los recibos se archivan en 
orden creciente de ventas, el muestreo aleatorio sistemático no garantiza una muestra aleato- 
ria. Debe aplicar otros métodos de muestreo. 

Muestreo aleatorio estratificado 

Cuando una población se divide en grupos a partir de ciertas características, se aplica el mues- 
treo aleatorio estratificado con el fin de garantizar que cada grupo se encuentre representa- 
do en la muestra. A los grupos también se les denomina estratos. Por ejemplo, los estudiantes 
universitarios se pueden agrupar en estudiantes de tiempo completo o de medio tiempo, por 
sexo, masculino o femenino, tradicionales o no tradicionales. Una vez definidos los estratos, se 
aplica el muestreo aleatorio simple en cada grupo o estrato con el fin de formar la muestra. 


MUESTRA ALEATORIA ESTRATIFICADA Una población se divide en subgrupos, denominados 
estratos, y se selecciona al azar una muestra de cada estrato. 


Por ejemplo, puede estudiar los gastos en publicidad de las 352 empresas más grandes 
de Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empre- 
sas con altos rendimientos sobre el capital (una medida de rentabilidad) gastan en publicidad 
la mayor parte del dinero ganado que las empresas con un registro de bajo rendimiento o défi- 
cit. Para asegurar que la muestra sea una representación ¡mparcial de las 352 empresas, éstas 
se deben agrupar de acuerdo con su rendimiento porcentual sobre el capital. La tabla 8-1 
Incluye los estratos y las frecuencias relativas. Si aplicara el muestreo aleatorio simple, obser- 
ve que las empresas del tercero y cuarto estratos tienen una probabilidad alta de que se les 
seleccione (0.87), mientras que las empresas de los demás estratos tienen menos (0.13). 
Podría no seleccionar ninguna de las empresas que aparecen en los estratos 1 o 5 sencilla- 
mente por azar. No obstante, el muestreo aleatorio estratificado garantizará que por lo menos 
una empresa de los estratos 1 o 5 aparezca en la muestra. Considere una selección de 50 
compañías para llevar a cabo un estudio minucioso. Entonces se seleccionará de forma alea- 
toria 1 (0.02 X 50) empresas del estrato 1; 5 (0.10 X 50), del estrato 2, etc. En este caso, el 
número de empresas en cada estrato es proporcional a la frecuencia relativa del estrato en la 
población. El muestreo estratificado ofrece la ventaja de que, en algunos casos, refleja con 
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Muchos métodos más de 
muestreo. 


Autoevaluación 8-2 



mayor fidelidad las características de la población que el muestreo aleatorio simple o el mues- 
treo aleatorio sistemático. 

TABLA 8-1 Número seleccionado de una muestra aleatoria estratificada proporcional 


Estrato 

Probabilidad 

(recuperación de capital) 

Número de 
empresas 

Frecuencia 

relativa 

Número 

muestreado 

1 

30% y más 

8 

0.02 

1* 

2 

De 20% a 30% 

35 

0.10 

5* 

3 

De 10% a 20% 

189 

0.54 

27 

4 

De 0% a 10% 

115 

0.33 

16 

5 

Déficit 

5 

0.01 

1 

Total 


352 

1.00 

50 


* 0.02 de 50 = 1, 0.10 de 50 = 5, etcétera. 

Muestreo por conglomerados 

Otro tipo común de muestreo es el muestreo por conglomerados, que a menudo se emplea 
para reducir el costo de muestrear una población dispersa en cierta área geográfica. 


MUESTREO POR CONGLOMERADOS La población se divide en conglomerados a partir de los lími- 
tes naturales geográficos o de otra clase. A continuación se seleccionan los conglomerados 
al azar y se toma una muestra de forma aleatoria con elementos de cada grupo. 


Suponga que desea determinar la opinión de los residentes de algún estado con referen- 
cia a las políticas federales y estatales de protección ambiental. Seleccionar una muestra alea- 
toria de residentes y ponerse en contacto con cada persona requeriría mucho tiempo y resul- 
taría muy costoso. Sería mejor aplicar el muestreo por conglomerados y subdividir el estado 
en pequeñas unidades: condados o regiones. Con frecuencia se les conoce como unidades 
primarias. 

Suponga que dividió el estado en 12 unidades primarias, seleccionó al azar cuatro regio- 
nes, 2, 7, 4 y 12, y concentró su atención en estas unidades primarias. Usted puede tomar una 
muestra aleatoria de los residentes de cada una de estas regiones y entrevistarse con ellos 
(observe que se trata de una combinación de un muestreo por conglomerados y un muestreo 
aleatorio simple). 



El estudio de los métodos de muestreo de las secciones anteriores no incluye todos los 
métodos de muestreo disponibles para el investigador. Si usted emprendiera un proyecto de 
investigación importante de marketing, finanzas, contabilidad u otras áreas, necesitaría con- 
sultar libros dedicados exclusivamente a la teoría del muestreo y al diseño de muestras. 


Consulte la autoevaluación 8-1 y la lista de alumnos de la página 269. Suponga que en un muestreo 
aleatorio sistemático se debe elegir a cada noveno estudiante de la clase. Al principio se elige al 
azar al cuarto estudiante de la lista. Dicho estudiante es el número 03. Recuerde que los números 
aleatorios comienzan con 00, entonces, ¿qué estudiantes se elegirán como miembros de la 
muestra? 
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Ejercicios 

1. La siguiente lista incluye las tiendas de Marco’s Pizza en el condado de Lucas. También se indica 
si la tienda es propiedad de alguna corporación (C) o del administrador (A). Se debe seleccionar e 
inspeccionar una muestra de cuatro establecimientos en relación con la conveniencia para el clien- 
te, la seguridad, la higiene y otras características. 


Número de 

identificación Dirección 

Tipo 

Número de 
identificación 

Dirección 

Tipo 

00 

2607 Starr Av 

C 

12 

2040 Ottawa River Rd 

C 

01 

309 W Alexis Rd 

C 

13 

2116 N Reynolds Rd 

C 

02 

2652 W Central Av 

c 

14 

3678 Rugby Dr 

c 

03 

630 Dixie Hwy 

A 

15 

1 41 9 South Av 

c 

04 

3510 Dorr St 

C 

16 

1 234 W Sylvania Av 

c 

05 

5055 Glendale Av 

C 

17 

4624 Woodville Rd 

A 

06 

3382 Lagrange St 

A 

18 

5155 S Main 

A 

07 

2525 W Laskey Rd 

C 

19 

106 E Airport Hwy 

C 

08 

303 Louisiana Av 

C 

20 

6725 W Central 

A 

09 

149 Main St 

C 

21 

4252 Monroe 

C 

10 

835 S McCord Rd 

A 

22 

2036 Woodville Rd 

C 

11 

3501 Monroe St 

A 

23 

1316 Michigan Av 

A 


a) Los números aleatorios seleccionados son 08, 18, 11, 02, 41 y 54. ¿Qué tiendas se eligieron? 

b) Utilice la tabla de números aleatorios para seleccionar su propia muestra de establecimientos. 

c) Una muestra consta de cada séptimo establecimiento. El número 03 es el punto de partida. 
¿Qué establecimientos se incluirán en la muestra? 

d) Suponga que una muestra consta de tres establecimientos, de los cuales dos son propiedad 
corporativa y uno del administrador. Seleccione una muestra adecuada. 

2. La siguiente lista incluye hospitales que se localizan en las regiones de Cincinnati (Ohio) y la región 
norte de Kentucky. También indica si se trata de un hospital general médico o quirúrgico (M/Q), o 
de especialidades (E). Se debe calcular el promedio de enfermeras que trabaja medio tiempo en 
los hospitales del área. 

a) Se debe seleccionar de forma aleatoria una muestra de cinco hospitales. Los números aleato- 
rios son 09, 16, 00, 49, 54, 12 y 04. ¿Qué hospitales se incluyen en la muestra? 

b) Utilice una tabla de números aleatorios para formar su propia muestra de cinco hospitales. 


Número de 

identificación Nombre 

Dirección 

Tipo 

Número de 

identificación Nombre 

Dirección 

Tipo 

00 

Bethesda North 

10500 Montgomery 

M/Q 

10 

Christ Hospital 

2139 Auburn Avenue 

M/Q 



Cincinnati, Ohio 45242 




Cincinnati, Ohio 45219 


01 

Ft. Hamilton-Hughes 630 Eaton Avenue 

M/Q 

11 

Deaconess 

31 1 Straight Street 

M/Q 



Hamilton, Ohio 45013 



Hospital 

Cincinnati, Ohio 45219 


02 

Jewish Hospital- 

4700 East Galbraith Rd. 

M/Q 

12 

Good Samaritan 

375 Dixmyth Avenue 

M/Q 


Kenwood 

Cincinnati, Ohio 45236 



Hospital 

Cincinnati, Ohio 45220 


03 

Mercy Hospital- 

3000 Mack Road 

M/Q 

13 

Jewish Hospital 

3200 Burnet Avenue 

M/Q 


Fairfield 

Fairfield, Ohio 45014 




Cincinnati, Ohio 45229 


04 

Mercy Hospital- 

100 Riverfront Plaza 

M/Q 

14 

University Hospital 

234 Goodman Street 

M/Q 


Hamilton 

Hamilton, Ohio 45011 




Cincinnati, Ohio 45267 


05 

Middletown 

105 McKnight Drive 

M/Q 

15 

Providence Hospital 

2446 Kipling Avenue 

M/Q 


Regional 

Middletown, Ohio 45044 




Cincinnati, Ohio 45239 


06 

Clermont Mercy 

3000 Hospital Drive 

M/Q 

16 

St. Francis- 

3131 Queen City Avenue 

M/Q 


Hospital 

Batavia, Ohio 451 03 



St. George Hospital 

Cincinnati, Ohio 45238 


07 

Mercy Hospital- 

7500 State Road 

M/Q 

17 

St. Elizabeth Medical 

401 E. 20th Street 

M/Q 


Anderson 

Cincinnati, Ohio 45255 



Center, North Unit 

Covington, Kentucky 41 01 4 


08 

Bethesda Oak 

619 Oak Street 

M/Q 

18 

St. Elizabeth Medical 

One Medical Village 

M/Q 


Hospital 

Cincinnati, Ohio 45206 



Center, South Unit 

Edgewood, Kentucky 41017 


09 

Children's Hospital 

3333 Burnet Avenue 

M/Q 

19 

St. Luke’s Hospital 

7380 Turfway Drive 

M/Q 


Medical Center 

Cincinnati, Ohio 45229 



West 

Florence, Kentucky 41075 
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Número de 




Número de 




identificación 

Nombre 

Dirección 

Tipo 

identificación 

Nombre 

Dirección 

Tipo 

20 

St. Luke’s Hospital 

85 North Grand Avenue 

M/Q 

25 

Drake Center Rehab — 

1 51 W. Galbraith Road 

E 


East 

Ft. Thomas, Kentucky 41042 



Long Term 

Cincinnati, Ohio 45216 


21 

Care Unit Hospital 

3156 Glenmore Avenue 

E 

26 

No. Kentucky Rehab 

201 Medical Village 

E 



Cincinnati, Ohio 45211 



Hospital — ShortTerm 

Edgewood, Kentucky 


22 

Emerson Behavioral 

2446 Klpllng Avenue 

E 

27 

Shriners Burns 

3229 Bumet Avenue 

E 


Science 

Cincinnati, Ohio 45239 



Institute 

Cincinnati, Ohio 45229 


23 

Pauline Warfield 

1101 Summit Road 

E 

28 

VA Medical Center 

3200 Vine 

E 


Lewis Center for 
Psychiatric Treat. 

Cincinnati, Ohio 45237 



Cincinnati, Ohio 45220 



24 

Children’s Psychiatric 

502 Farrell Drive 

E 






No. Kentucky 

Covington, Kentucky 41011 







c) Una muestra debe incluir cada quinto establecimiento. Se selecciona 02 como punto de par- 
tida. ¿Qué hospitales se incluirán en la muestra? 

d) Una muestra consta de cuatro hospitales médicos o quirúrgicos y un hospital de especialida- 
des. Seleccione una muestra adecuada. 

3. A continuación aparece una lista de los 35 miembros de la Metro Toledo Automobile Dealers 
Association. Se desea calcular el ingreso medio de los departamentos de servicios de los distri- 
buidores. 


Número de 

identificación Distribuidor 

Número de 

identificación Distribuidor 

Número de 

identificación Distribuidor 

00 

Dave White Acura 

11 

Thayer Chevrolet/Toyota 

23 

Kistler Ford, Inc. 

01 

Autofalr Nissan 

12 

Spurgeon Chevrolet Motor Sales, Inc. 

24 

Lexus of Toledo 

02 

AutofalrToyota-Suzuki 

13 

Dunn Chevrolet 

25 

Mathews Ford Oregon, Inc. 

03 

George Ball’s Bulck GMC Truck 

14 

Don Scott Chevrolet-Pontiac 

26 

Northtowne Chevrolet 

04 

Yark Automotive Group 

15 

Dave White Chevrolet Co. 

27 

Quality Ford Sales, Inc. 

05 

Bob Schmidt Chevrolet 

16 

DickWilson Pontlac 

28 

Rouen Chrysler Jeep Eagle 

06 

Bowling Green Lincoln Mercury 

17 

Doyle Pontlac Buick 

29 

Saturn of Toledo 


Jeep Eagle 

18 

Franklin Park Lincoln Mercury 

30 

Ed Schmidt Pontiac Jeep Eagle 

07 

Brandes Ford 

19 

Genoa Motors 

31 

Southside Lincoln Mercury 

08 

Brown Honda 

20 

Great Lakes Ford Nissan 

32 

Valiton Chrysler 

09 

Brown Mazda 

21 

Grogan Towne Chrysler 

33 

Vin Divers 

10 

Charlie's Dodge 

22 

Hatfield Motor Sales 

34 

Whitman Ford 


a) Seleccione una muestra aleatoria de cinco distribuidores. Los números aleatorios son: 05, 20, 
59, 21, 31, 28, 49, 38, 66, 08, 29 y 02. ¿Qué distribuidores se van a incluir en ia muestra? 

b) Utilice la tabla de números aleatorios para seleccionar su propia muestra de cinco distribui- 
dores. 

c) Una muestra constará de cada séptimo distribuidor. El número 04 se selecciona como punto 
de partida. ¿Qué distribuidores se incluyen en la muestra? 

4. En seguida se enumera a los 27 agentes de seguros de Nationwide Insurance en el área metropo- 
litana de Toledo, Ohio. Se desea calcular el promedio de años que han laborado en Nationwide. 


Número de 
identificación 

Agente 

Número de 
identificación 

Agente 

Número de 
identificación 

Agente 

00 

Bly Scott 3332 W Laskey Rd 


10 

Heini Bernie 71 1 0 W Centra 

19 

Riker Craig 2621 N Reynolds Rd 

01 

Coyle Mike 5432 W Central Av 


11 

Hinckley Dave 

20 

Schwab Dave 572 W Dussel Dr 

02 

Denker Brett 7445 Airport Hwy 



14 N Holland Sylvania Rd 

21 

Seibert John H 201 S Main 

03 

Denker Rollie 7445 Airport Hwy 


12 

Joehlin Bob 3358 Navarra Av 

22 

Smithers Bob 229 Superior St 

04 

Farley Ron 1 837 W Alexis Rd 


13 

Keisser David 3030 W Sylvania Av 

23 

Smithers Jerry 229 Superior St 

05 

George Mark 7247 W Central Av 


14 

Keisser Keith 5902 Sylvania Av 

24 

Wright Steve 1 05 S Thlrd St 

06 

Gibellato Cario 6616 Monroe St 


15 

Lawrence Grant 342 W Dussel Dr 

25 

Wood Tom 1 1 2 Louisiana Av 

07 

Glemser Cathy 5602 Woodville Rd 


16 

Miller Ken 2427 Woodville Rd 

26 

Yoder Scott 6 Willoughby Av 

08 

Green Mike 4149 Holland Sylvania Rd 

17 

O’Donnell Jim 7247 W Central Av 



09 

Harris Ev 2026 Albon Rd 


18 

Priest Harvey 51 1 3 N Summit St 
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OA3 Definir un error de 
muestreo. 


Cjemplo 


Solución 


a) Seleccione una muestra aleatoria de cuatro agentes. Los números aleatorios son: 02, 59, 51, 
25, 14, 29, 77, 69 y 18. ¿Qué distribuidores se incluirán en la muestra? 

b) Utilice la tabla de números aleatorios para seleccionar su propia muestra de cuatro agentes. 

c) Una muestra consta de cada séptimo distribuidor. El número 04 se selecciona como punto de 
partida. ¿Qué agentes se deben incluir en la muestra? 

8.3 "Error" de muestreo 

En la sección anterior se estudiaron métodos de muestreo útiles para seleccionar una mues- 
tra que constituya una representación imparcial o sin sesgos de la población. Es importante 
señalar que, en cada método, la selección de cualquier posible muestra de determinado tama- 
ño de una población tiene una posibilidad o probabilidad conocida, que constituye otra forma 
de describir un método de muestreo sin sesgo. 

Las muestras se emplean para determinar características de la población. Por ejemplo, 
con la media de una muestra se calcula la media de la población. No obstante, como la mues- 
tra forma parte o es una porción representativa de la población, es poco probable que su 
media sea exactamente igual a la media poblacional. Asimismo, es poco probable que la des- 
viación estándar de la muestra sea exactamente igual a la desviación estándar de la población. 
Por lo tanto, puede esperar una diferencia entre un estadístico de la muestra y el parámetro de 
la población correspondiente. Esta diferencia recibe el nombre de error de muestreo. 


ERROR DE MUESTREO Diferencia entre el estadístico de una muestra y el parámetro de la 
población correspondiente. 


El siguiente ejemplo aclara el concepto de error de muestreo. 


Revise el ejemplo anterior de la página 268, en el que estudió el número de habitaciones ren- 
tadas en Foxtrot Inn, en Tryon, Carolina del Norte. La población se refiere al número de habita- 
ciones rentadas cada uno de los 30 días de junio de 201 1 . Determine la media de la población. 
Utilice Excel u otro software de estadística para seleccionar tres muestras aleatorias de cinco 
días. Calcule la media de cada muestra y compárela con la media poblacional. ¿Cuál es el error 
de muestreo en cada caso? 

Durante el mes se rentaron un total de 94 habitaciones. Por lo tanto, la media de las unidades 
que se rentaron por noche es de 3.13. Ésta es la media de la población. Este valor se designa 
con la letra griega jjl. 

2X 0 + 2 + 3 + -- - + 3 94 _ 

^ N ~ 30 " 30 " 3 ‘ 3 

La primera muestra aleatoria de cinco noches dio como resultado el siguiente número de habi- 
taciones rentadas: 4, 7, 4, 3 y 1 . La media de esta muestra de cinco noches es de 3.8 habita- 
ciones, que se representa como X r La barra sobre la X recuerda que se trata de una media 
muestral, y el subíndice 1 indica que se trata de la media de la primera muestra. 

- 2X 4 + 7 + 4 + 3 + 1 19 

X-, = = = — = 3.80 

1 n 5 5 

El error de muestreo de la primera muestra es la diferencia entre la media poblacional (3.13) y 
la media muestral (3.80). De ahí que el error muestral sea (X 1 - |x = 3.80 - 3.13 = 0.67). La 
segunda muestra aleatoria de cinco días de la población de 30 días de junio arrojó el siguien- 
te número de habitaciones rentadas: 3, 3, 2, 3 y 6. La media de estos cinco valores es de 3.4, 
que se calcula de la siguiente manera: 

- 2X 3 + 3-F2 + 3 + 6 
X 2 = = = 3.4 

¿ n 5 

El error de muestreo es (X 2 — |x = 3.4 — 3.13 = 0.27). 
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En la tercera muestra aleatoria, la media fue de 1 .8, y el error de muestro fue de —1 .33. 

Cada una de estas diferencias, 0.67, 0.27 y —1.33, representa el error de muestreo come- 
tido al calcular la media de la población. A veces estos errores son valores positivos, lo cual 
indica que la media muestral sobreexcedió la media poblacional; otras veces son valores nega- 
tivos, lo cual indica que la media muestral resultó Inferior a la media poblacional. 
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Una media simple es una 
estimación sin sesgo de la 
media poblacional. 




En este caso, con una población de 30 valores y muestras de 5 valores, existe una gran 
cantidad de muestras posibles, 142 506, para ser exactos. Para calcular este valor se aplica la 
fórmula de las combinaciones (5-10), de la página 174. Cada una de las 142 506 diferentes 
muestras cuenta con las mismas posibilidades de que se le seleccione. Cada muestra puede 
tener una media muestral diferente y, por consiguiente, un error de muestreo distinto. El valor 
del error de muestreo se basa en el valor particular de las 142 506 muestras posibles seleccio- 
nadas. Por consiguiente, los errores de muestreo son aleatorios y se presentan al azar. Si deter- 
minara la suma de estos errores de muestreo en una gran cantidad de muestras, el resultado 
se aproximaría mucho a cero. Sucede así porque la media de la muestra constituye un estima- 
dor sin sesgo de la media de la población. 


8.4 Distribución muestral de la media 


OA4 Definir y construir una 
distribución muestral de la 
media de la muestra. 


Las medias muéstrales varían 
de muestra en muestra. 


Debido a que existe la posibilidad de que se presente un error de muestreo cuando se em- 
plean los resultados del muestreo para aproximar un parámetro poblacional, ¿cómo hacer un 
pronóstico preciso relacionado con el posible éxito de un nuevo dentífrico u otro producto 
sobre la única base de los resultados del muestreo? ¿Cómo puede el departamento de con- 
trol de calidad de una compañía de producción en serie enviar un cargamento de microchips 
a partir de una muestra de 10 chips? ¿Cómo pueden las organizaciones electorales de CNN- 
USA Today o ABC News-Washington Post hacer pronósticos precisos sobre la elección presi- 
dencial con base en una muestra de 1 200 electores registrados de una población de cerca de 
90 millones? Para responder estas preguntas, primero hay que precisar el concepto de distri- 
bución muestral de la media. 

Las medias muéstrales del ejemplo anterior varían de una muestra a la siguiente. La media 
de la primera muestra de 5 días fue de 3.80 habitaciones, y la media de la segunda muestra 
fue de 3.40 habitaciones. La media poblacional fue de 3.13 habitaciones. Si se organizan las 
medias de todas las muestras posibles de 5 días en una distribución de probabilidad, el resul- 
tado recibe el nombre de distribución muestral de la media. 


DISTRIBUCIÓN MUESTRAL DE LA MEDIA Distribución de probabilidad de todas las posibles 
medias de las muestras de un determinado tamaño muestral de la población. 
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El siguiente ejemplo ilustra la construcción de una distribución muestral de la media. 


Cjemplo 



Solución 



Tartus Industries cuenta con siete empleados de producción (a quienes se les considera la 
población). En la tabla 8-2 se incluyen los ingresos por hora de cada uno de ellos. 

TABLA 8-2 Ingresos por hora de empleados de producción en Tartus Industries 


Empleado 

Ingresos por hora 

Empleado 

Ingresos por hora 

Joe 

$7 

Jan 

$7 

Sam 

7 

Art 

8 

Sue 

8 

Ted 

9 

Bob 

8 




1 . 

2 . 

3. 

4. 


¿Cuál es la media de la población? 

¿Cuál es la distribución muestral de la media de muestras de tamaño 2? 

¿Cuál es la media de la distribución muestral de la media? 

¿Qué observaciones es posible hacer sobre la población y la distribución muestral de la 
media? 


He aquí las respuestas. 


1 . 


La media de la población es de $7.71 , que se determina de la siguiente manera: 

2X _ $7 + $7 + $8 + $8 + $7 + $8 + $9 
N 1 




= $7.71 


2 . 


Identifique la media de la población por medio de la letra griega p. En los capítulos 1 , 3 y 
4 se convino en identificar los parámetros poblacionales con letras griegas. 

Para obtener la distribución muestral de la media se seleccionó, sin reemplazos de la pobla- 
ción, todas las muestras posibles de tamaño 2 y se calcularon las medias de cada mues- 
tra. Hay 21 muestras posibles, que se calcularon con la fórmula (5-10) de la página 174. 

N\ - 71 --i 

N n ~ n\(N - n)\ ~ 21(7 - 2)! ~ 

donde N = 7 es el número de elementos de la población, y n = 2, el número de elemen- 
tos de la muestra. 

En la tabla 8-3 se ilustran las 21 medias muéstrales de todas las muestras posibles de 
tamaño 2 que pueden tomarse de la población. Estas 21 muestras se utilizan para cons- 
truir una distribución de probabilidad, que es la distribución muestral de la media, la cual 
se resume en la tabla 8-4. 

TABLA 8-3 Medias muéstrales de todas las muestras posibles de 2 empleados 


Muestra Empleados 

Ingresos 
por hora 

Suma 

Media 

Muestra 

Empleados 

Ingresos 
por hora 

Suma Media 

1 

Joe, Sam 

$7, $7 

$14 

$7.00 

12 

Sue, Bob 

$8, 

$8 

$16 

$8.00 

2 

Joe, Sue 

7, 8 

15 

7.50 

13 

Sue, Jan 

8, 

7 

15 

7.50 

3 

Joe, Bob 

7, 8 

15 

7.50 

14 

Sue, Art 

8, 

8 

16 

8.00 

4 

Joe, Jan 

7, 7 

14 

7.00 

15 

Sue, Ted 

8, 

9 

17 

8.50 

5 

Joe, Art 

7, 8 

15 

7.50 

16 

Bob, Jan 

8, 

7 

15 

7.50 

6 

Joe, Ted 

7, 9 

16 

8.00 

17 

Bob, Art 

8, 

8 

16 

8.00 

7 

Sam, Sue 

7, 8 

15 

7.50 

18 

Bob, Ted 

8, 

9 

17 

8.50 

8 

Sam, Bob 

7, 8 

15 

7.50 

19 

Jan, Art 

7, 

8 

15 

7.50 

9 

Sam, Jan 

7, 7 

14 

7.00 

20 

Jan, Ted 

7, 

9 

16 

8.00 

10 

Sam, Art 

7, 8 

15 

7.50 

21 

Art, Ted 

8, 

9 

17 

8.50 

11 

Sam, Ted 

7, 9 

16 

8.00 
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TABLA 8-4 Distribución muestral de la media con n — 2 



3. La media de la distribución muestral de la media se obtiene al sumar las medias muéstra- 
les y dividir la suma entre el número de muestras. La media de todas las medias mués- 
trales se representa mediante |jl^. La p, recuerda que se trata de un valor poblacional, pues 
tomó en cuenta todas las muestras posibles. El subíndice X indica que se trata de la dis- 
tribución muestral de la media. 


La media de la población 
es igual a la media de las 
medias muéstrales. 


Vx = 


Suma de todas las medias muéstrales 
Total de muestras 


$7.00 + $7.50 + ■■■ + $8.50 
21 


$162 

21 


$7.71 


4. Consulte la gráfica 8-1 , donde aparecen las dos distribuciones poblacionales y la distribu- 
ción muestral de la media. Caben las siguientes observaciones: 

a) La media de la distribución muestral de la media ($7.71) es igual a la media de la pobla- 
ción: p = px. 

b) La dispersión de la distribución muestral de las medias es menor que la dispersión de 
los valores de población. La media de las muestras varía de $7.00 a $8.50, mientras 
que los valores de población varían de $7.00 a $9.00. Observe que, conforme se incre- 
menta el tamaño de la muestra, se reduce la dispersión de la distribución muestral de 
las medias. 

c) La forma de la distribución muestral de la media y la forma de la distribución de fre- 
cuencias de los valores de población son diferentes. La distribución muestral de las 
medias tiende a adoptar más forma de campana y a aproximarse a la distribución de 
probabilidad normal. 


Distribución de población 


Distribución muestral de las medias 


dad 

O 



O 

pep 


1 -30 



I -30 


S .20 



S .20 


Q_ 

.10 


1 

Q_ 

.10 



7 (i 8 9 Ingresos por hora 7 7.5 _8 8.5 9 X Media de la muestra 

PX o ingresos por hora 



En resumen, tome todas las posibles muestras aleatorias de una población y calcule un 
estadístico muestral (la media de los ingresos percibidos) de cada una. Este ejemplo ilustra las 
Importantes relaciones entre la distribución poblacional y la distribución muestral de la media: 

1 . La media de las medias de las muestras es exactamente igual a la media de la población. 

2. La dispersión de la distribución muestral de la media es más estrecha que la distribución 
poblacional. 

La distribución muestral de la media suele tener forma de campana y se aproxima a la dis- 
tribución de probabilidad normal. 


3 . 



278 


CAPÍTULO 8 Métodos de muestreo y teorema central del límite 


Dada una distribución de probabilidad normal o de forma de campana, se aplican los con- 
ceptos del capítulo 7 para determinar la probabilidad de seleccionar una muestra con una 
media muestral específica. En la siguiente sección se resalta la importancia del tamaño de 
una muestra en relación con la distribución muestral de la media. 


r 


Autoevaluación 


8-3 



Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los siguientes: 


Nombre 

Años 

Señor Snow 

20 

Señora Tolson 

22 

Señor Kraft 

26 

Señora Irwin 

24 

Señor Jones 

28 


a) De acuerdo con la fórmula de las combinaciones, ¿cuántas muestras de tamaño 2 son posibles? 

b) Elabore una lista de todas las muestras posibles de 2 ejecutivos de la población y calcule las 
medias. 

c) Organice las medias en una distribución muestral. 

d) Compare la media poblacional y la media de las medias de las muestras. 

e) Compare la dispersión en la población con la dispersión de la distribución muestral de la media. 

f) A continuación se muestra una gráfica con los valores de la población. ¿Tienen los valores de 
población una distribución normal (en forma de campana)? 



g) ¿Comienza la distribución muestral de la media que se calculó en el inciso c) a indicar una ten- 
dencia a adoptar forma de campana? 


comect 


Ejercicios 

5. Una población consta de los siguientes cuatro valores: 12, 12, 14 y 16. 

a) Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra. 

b ) Calcule la media de la distribución muestral de la media y la media de la población. Compare 
los dos valores. 

c) Compare la dispersión en la población con la de las medias de las muestras. 

6. Una población consta de los siguientes cinco valores: 2, 2, 4, 4 y 8. 

a) Enumere todas las muestras de tamaño 2 y calcule la media de cada muestra. 

b) Calcule la media de la distribución muestral de las medias y la media de la población. Compare 
los dos valores. 

c) Compare la dispersión en la población con la de las medias de las muestras. 

7. Una población consta de los siguientes cinco valores: 12, 12, 14, 15 y 20. 

a) Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra. 

b) Calcule la media de la distribución muestral de las medias y la media de la población. Compare 
los dos valores. 

c) Compare la dispersión de la población con la de las medias de las muestras. 

8. Una población consta de los siguientes cinco valores: 0, 0, 1 , 3 y 6. 

a) Enumere todas las muestras de tamaño 3 y calcule la media de cada muestra. 

b) Calcule la media de la distribución muestral de las medias y la media de la población. Compare 
los dos valores. 

c) Compare la dispersión de la población con la de las medias de las muestras. 

9. El despacho de abogados Tybo and Associates consta de seis socios. En la siguiente tabla se 
incluye el número de casos que en realidad atendió cada socio en los tribunales durante el mes 
pasado. 
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OA5 Comprender y explicar 
el teorema central del límite. 


Socio 

Número de casos 

Ruud 

3 

Wu 

6 

Sass 

3 

Flores 

3 

Wilhelms 

0 

Schueller 

1 


a) ¿Cuántas muestras de 3 son posibles? 

b) Enumere todas las muestras posibles de 3 y calcule el número medio de casos en cada mues- 
tra. 

c) Compare la media de la distribución muestral de las medias con la de la media poblacional. 

d) En una gráfica similar a la 8-1, compare la dispersión en la población con la de las medias 
muéstrales. 

10. Mid-Motors Ford tiene cinco vendedores. Los cinco representantes de ventas y el número de auto- 
móviles que vendieron la semana pasada son los siguientes: 


Representantes 
de ventas 

Autos 

vendidos 

Peter Hankish 

8 

Connie Stallter 

6 

Juan López 

4 

Ted Barnes 

10 

Peggy Chu 

6 


a) ¿Cuántas muestras de tamaño 2 son posibles? 

b) Enumere todas las muestras posibles de tamaño 2 y calcule la media en cada muestra. 

c) Compare la media de la distribución muestral de la media con la de la media poblacional. 

d ) En una gráfica similar a la 8-1 , compare la dispersión de la población con la de la media de la 
muestra. 


8.5 Teorema central del límite 

En esta sección se estudia el teorema central del límite. Su aplicación a la distribución mues- 
tral de medias, introducida en la sección anterior, permite utilizar la distribución de probabili- 
dad normal para crear intervalos de confianza de la media poblacional (que se describe en el 
capítulo 9) y llevar a cabo pruebas de hipótesis (descritas en el capítulo 10). El teorema cen- 
tral del límite hace hincapié en que, en el caso de muestras aleatorias grandes, la forma de la 
distribución muestral de la media se aproxima a la distribución de probabilidad normal. La 
aproximación es más exacta en el caso de muestras grandes que en el de muestras peque- 
ñas. Ésta es una de las conclusiones más útiles de la estadística. Permite razonar sobre la dis- 
tribución de las medias muéstrales sin ninguna información acerca de la forma de la distribu- 
ción de la población de la que se toma la muestra. En otras palabras, el teorema central del 
límite se cumple en el caso de todas las distribuciones. 

En seguida aparece el enunciado formal del teorema central del límite. 


TEOREMA CENTRAL DEL LÍMITE Si todas las muestras de un tamaño en particular se seleccio- 
nan de cualquier población, la distribución muestral de la media se aproxima a una distribu- 
ción normal. Esta aproximación mejora con muestras más grandes. 


Si la población obedece a una distribución normal, entonces, en el caso de cualquier 
tamaño de muestra, la distribución muestral de las medias también será de naturaleza normal. 
Si la distribución poblacional es simétrica (pero no normal), se verá que la forma normal de la 
distribución muestral de las medias se presenta con muestras tan pequeñas como 10. Por otra 
parte, si se comienza con una distribución sesgada o con colas anchas, quizá se requieran 
muestras de 30 o más para observar la característica de normalidad. Este concepto se resu- 
me en la gráfica 8-2 para diversas formas de población. Observe la convergencia hacia una 
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GRAFICA 8-2 Resultados del teorema central del límite para diversas poblaciones 


Cualquier distribución 
muestral de la media de una 
muestra se moverá hacia 
una distribución normal a 
medida que incrementamos 
su tamaño. 


distribución normal sin que importe la forma de la distribución de la población. La mayoría de 
los especialistas en estadística consideran que una muestra de 30 o mayor es lo bastante 
grande para aplicar el teorema central del límite. 

La idea de que la distribución muestral de las medias de una población que no es normal 
converge hacia la normalidad se ilustra en las gráficas 8-3, 8-4 y 8-5. En breve se analizará 
este ejemplo con más detalles, pero la gráfica 8-3 es la gráfica de una distribución de proba- 
bilidad discreta con sesgo positivo. Hay varias muestras posibles de tamaño 5 que puede 
seleccionar de esta población. Suponga que selecciona al azar 25 muestras de tamaño 5 cada 
una y calcula la media de cada muestra. Estos resultados aparecen en la gráfica 8-4. Observe 
que la forma de la distribución muestral de las medias cambió la forma de la población origi- 
nal aunque sólo seleccionó 25 de las diversas muestras posibles. En otras palabras, eligió 25 
muestras al azar de tamaño 5 de una población positivamente sesgada, y encontró que la dis- 
tribución muestral de las medias cambió en lo que se refiere a la forma de la población. A 
medida que toma muestras más grandes, es decir, n = 20 en lugar de n = 5, la distribución 
muestral de las medias se aproximará a la distribución normal. La gráfica 8-5 muestra los 
resultados de 25 muestras aleatorias de 20 observaciones cada una tomadas de la misma 
población. Note la clara tendencia hacia la distribución de probabilidad normal. Ésta es la 
esencia del teorema central del límite. El siguiente ejemplo pondrá de relieve esta condición. 
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Cjemplo 


Solución 


Ed Spence fundó su negocio de engranes hace 20 años. El negocio creció a lo largo del tiem- 
po y ahora cuenta con 40 empleados. Spence Sprockets, Inc., encara algunas decisiones 
importantes relacionadas con la atención médica de su personal. Antes de tomar una decisión 
definitiva sobre el programa de atención médica que va a comprar, Ed decide formar un comi- 
té de cinco empleados. Se pedirá al comité que estudie el tema del cuidado de la salud y haga 
alguna recomendación sobre el plan que mejor convenga a los empleados. Ed cree que el 
punto de vista de los empleados más recientes en relación con el cuidado de la salud difiere 
de los empleados con más experiencia. Si Ed selecciona al azar este comité, ¿qué puede espe- 
rar en términos del promedio de años que llevan con Spence Sprockets los miembros del comi- 
té? ¿Cuál es la forma de la distribución de los años de experiencia de todos los empleados (la 
población) en comparación con la forma de la distribución muestral de la media? Los tiempos 
de servicio (redondeados al año inmediato) de los 40 empleados que actualmente están en 
nómina en Spence Sprockers, Inc., son los siguientes: 


11 

4 

18 

2 

1 

2 

0 

2 

2 

4 

3 

4 

1 

2 

2 

3 

3 

19 

8 

3 

7 

1 

0 

2 

7 

0 

4 

5 

1 

14 

16 

8 

9 

1 

1 

2 

5 

10 

2 

3 


La gráfica 8-3 muestra la distribución de los años de experiencia de la población de los 40 
empleados. La distribución de tiempos de servicio tiene un sesgo positivo, pues unos cuan- 
tos empleados han laborado en Spence Sprockets por un periodo extenso. En específico, seis 
empleados han laborado en la compañía 10 años o más. Sin embargo, como el negocio cre- 
ció, el número de empleados se incrementó en los últimos cinco años. De los 40 empleados, 
18 han laborado en la compañía dos años o menos. 



GRÁFICA 8-3 Tiempo de servicio de los empleados en Spence Sprockets 

Considere el primero de los problemas de Ed Spence. A él le gustaría formar un comité de 
cinco empleados con el objeto de que estudien la cuestión del cuidado de la salud y sugieran 
el tipo de cobertura de gastos médicos más adecuada para la mayoría de ellos. ¿Cómo elegi- 
ría al comité? Si lo selecciona al azar, ¿qué puede esperar respecto del tiempo medio de ser- 
vicio de quienes forman parte del comité? 
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Para comenzar, Ed anota el tiempo de servicio de cada uno de los 40 empleados en pape- 
les y los coloca en una gorra de béisbol. Después los revuelve y selecciona al azar cinco de 
ellos. Los tiempos de servicio de estos cinco empleados son: 1, 9, 0, 19 y 14 años. Por lo tanto, 
el tiempo medio de servicio de estos cinco empleados muestreados es de 8.60 años. ¿Cómo 
se compara este resultado con la media de la población? En este momento, Ed no conoce la 
media de la población, aunque el número de empleados de la población es de sólo 40, así que 
decide calcular la media del tiempo de servicio de todos sus empleados. Ésta es de 4.8 años, 
que se determina al sumar los tiempos de servicio de todos los empleados y dividir el total 
entre 40. 


M- = 


11 + 4 + 18+--- + 2 + 3 
40 


4.80 



La diferencia entre la media de la muestra ( X) y la media de la población (|jl) recibe el nom- 
bre de error de muestreo. En otras palabras, la diferencia de 3.80 años entre la media pobla- 
cional de 4.80 y la media muestral de 8.60 es el error de muestreo. Éste se debe al azar. Por 
consiguiente, si Ed selecciona a estos cinco empleados para formar el comité, el tiempo medio 
de servicio de éstos sería mayor que el de la media de la población. 

¿Qué sucedería si Ed colocara de nuevo los papeles en la gorra y tomara otra muestra? 
¿Esperaría que la media de esta segunda muestra fuera exactamente la misma que la anterior? 
Suponga que selecciona otra muestra de cinco empleados y encuentra que los tiempos de ser- 
vicio de esta muestra son de 7, 4, 4, 1 y 3. La media muestral es de 3.80 años. El resultado de 
seleccionar 25 muestras de cinco empleados cada una se muestra en la tabla 8-5 y en la grá- 
fica 8-4. En realidad hay 658 008 muestras posibles de tamaño 5 que se pueden tomar de la 
población de 40 empleados, las cuales se determinan con la fórmula de las combinaciones 
(5-10) con 40 objetos tomados de 5 en 5. Observe la diferencia de forma de las distribuciones 

TABLA 8-5 Veinticinco muestras aleatorias de cinco empleados 


Muestra de 
identificación 

Datos de la muestra 


Media 

muestral 

A 

1 

9 

0 

19 

14 

8.6 

B 

7 

4 

4 

1 

3 

3.8 

C 

8 

19 

8 

2 

1 

7.6 

D 

4 

18 

2 

0 

11 

7.0 

E 

4 

2 

4 

7 

18 

7.0 

F 

1 

2 

0 

3 

2 

1.6 

G 

2 

3 

2 

0 

2 

1.8 

H 

11 

2 

9 

2 

4 

5.6 

1 

g 

0 

4 

2 

7 

4.4 

J 

i 

1 

1 

11 

1 

3.0 

K 

2 

0 

0 

10 

2 

2.8 

L 

0 

2 

3 

2 

16 

4.6 

M 

2 

3 

1 

1 

1 

1.6 

N 

3 

7 

3 

4 

3 

4.0 

0 

1 

2 

3 

1 

4 

2.2 

P 

19 

0 

1 

3 

8 

6.2 

Q 

5 

1 

7 

14 

9 

7.2 

R 

5 

4 

2 

3 

4 

3.6 

S 

14 

5 

2 

2 

5 

5.6 

T 

2 

1 

1 

4 

7 

3.0 

U 

3 

7 

1 

2 

1 

2.8 

V 

0 

1 

5 

1 

2 

1.8 

W 

0 

3 

19 

4 

2 

5.6 

X 

4 

2 

3 

4 

0 

2.6 

Y 

1 

1 

2 

3 

2 

1.8 
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GRÁFICA 8-4 Histograma de tiempos de servicio medio de 25 muestras de cinco empleados 


poblacional y muestral de medias. La población de tiempos de servicio de los empleados (grá- 
fica 8-3) tiene un sesgo positivo, y la distribución de estas 25 medias muéstrales no refleja el 
mismo sesgo positivo. También existe una diferencia en el rango de las medias muéstrales en 
comparación con el rango de la población. La población varía de 0 a 19 años, mientras que las 
medias muéstrales varían de 1 .6 a 8.6 años. 

La tabla 8-6 contiene los resultados de seleccionar 25 muestras de 20 empleados cada 
una y el cálculo de las medias muéstrales. Estas medias muéstrales aparecen en la gráfica 8-5. 
Compare la forma de esta distribución con la población (gráfica 8-3) y con la distribución mues- 
tral de medias si la muestra es de n = 5 (gráfica 8-4). Observe dos importantes características: 


Muestras aleatorias y medias muéstrales de 25 muestras de 20 empleados de Spence Sprockcts, Inc. 


Número de 
muestra 





Datos de la muestra (tiempo de servicio) 







Media 

muestral 

A 

3 

8 

3 

0 

2 

1 

2 

3 

11 

5 

1 

3 

4 

2 

7 

1 

1 

2 

4 

16 

3.95 

B 

2 

3 

8 

2 

1 

5 

2 

0 

3 

1 

0 

7 

1 

4 

3 

11 

4 

4 

3 

1 

3.25 

C 

14 

5 

0 

3 

2 

14 

11 

9 

2 

2 

1 

2 

19 

1 

0 

1 

4 

2 

19 

8 

5.95 

D 

9 

2 

1 

1 

4 

10 

0 

8 

4 

3 

2 

1 

0 

8 

1 

14 

5 

10 

1 

3 

4.35 

E 

18 

1 

2 

2 

4 

3 

2 

8 

2 

1 

0 

19 

4 

19 

0 

1 

4 

0 

3 

14 

5.35 

F 

10 

4 

4 

18 

3 

3 

1 

0 

0 

2 

2 

4 

7 

10 

2 

0 

3 

4 

2 

1 

4.00 

G 

5 

7 

11 

8 

11 

18 

1 

1 

16 

2 

2 

16 

2 

3 

2 

16 

2 

2 

2 

4 

6.55 

H 

3 

0 

2 

0 

5 

4 

5 

3 

8 

3 

2 

5 

1 

1 

2 

9 

8 

3 

16 

5 

4.25 

1 

0 

0 

18 

2 

1 

7 

4 

1 

3 

0 

3 

2 

11 

7 

2 

8 

5 

1 

2 

3 

4.00 

J 

2 

7 

2 

4 

1 

3 

3 

2 

5 

10 

0 

1 

1 

2 

9 

3 

2 

19 

3 

2 

4.05 

K 

7 

4 

5 

3 

3 

0 

18 

2 

0 

4 

2 

7 

2 

7 

4 

2 

10 

1 

1 

2 

4.20 

L 

0 

3 

10 

5 

9 

2 

1 

4 

1 

2 

1 

8 

18 

1 

4 

3 

3 

2 

0 

4 

4.05 

M 

4 

1 

2 

1 

7 

3 

9 

14 

8 

19 

4 

4 

1 

2 

0 

3 

1 

2 

1 

2 

4.40 

N 

3 

16 

1 

2 

4 

4 

4 

2 

1 

5 

2 

3 

5 

3 

4 

7 

16 

1 

11 

1 

4.75 

0 

2 

19 

2 

0 

2 

2 

16 

2 

3 

11 

9 

2 

8 

0 

8 

2 

7 

3 

2 

2 

5.10 

P 

2 

18 

16 

5 

2 

2 

19 

0 

1 

2 

11 

4 

2 

2 

1 

4 

2 

0 

4 

3 

5.00 

Q 

3 

2 

3 

11 

10 

1 

1 

5 

19 

16 

7 

10 

3 

1 

1 

1 

2 

2 

3 

1 

5.10 

R 

2 

3 

1 

2 

7 

4 

3 

19 

9 

2 

2 

1 

1 

2 

2 

2 

1 

8 

0 

2 

3.65 

S 

2 

14 

19 

1 

19 

2 

8 

4 

2 

2 

14 

2 

8 

16 

4 

7 

2 

9 

0 

7 

7.10 

T 

0 

1 

3 

3 

2 

2 

3 

1 

1 

0 

3 

2 

3 

5 

2 

10 

14 

4 

2 

0 

3.05 

U 

1 

0 

1 
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1 . La forma de la distribución muestral de las medias es diferente a la de la población. En la 
gráfica 8-3, la distribución de empleados tiene un sesgo positivo. No obstante, conforme 
selecciona muestras aleatorias de la población, cambia la forma de la distribución mues- 
tral de las medias. A medida que incrementa el tamaño de la muestra, la distribución 
muestral de las medias se aproxima a la distribución de probabilidad normal. Este hecho 
se ilustra con el teorema central del límite. 

2. Hay menos dispersión en la distribución muestral de las medias que en la distribución de 
la población. En la población, los periodos de servicio variaron de 0 a 19 años. Cuando 
seleccionó muestras de tamaño 5, las medias de las muestras variaron de 1 .6 a 8.6 años, 
y cuando seleccionó muestras de 20, las medias variaron de 3.05 a 7.10 años. 



GRÁFICA 8-5 


Histograma del tiempo medio de servicio de 25 muestras de 20 empleados 


También puede comparar la media de las medias de la muestra con la media de la pobla- 
ción. La media de las 25 muestras de los 20 empleados de la tabla 8-6 es de 4.676 años. 

3.95 + 3.25 + ■ ■ • + 4.30 + 5.05 „ _ 

Wr = — = 4.676 

Emplee el símbolo p.^ para identificar la media de la distribución muestral de las medias. El 
subíndice recuerda que la distribución se refiere a la media muestral. Se lee mu subíndice X 
barra. Observe que la media de las medias muéstrales, 4.676 años, se encuentra muy próxima 
a la medía de la población de 4.80. 


¿Qué concluye de este ejemplo? El teorema central del límite indica que, sin que importe 
la forma de la distribución de la población, la distribución muestral de la media se aproximará 
a la distribución de probabilidad normal. Cuanto mayor sea el número de observaciones en 
cada muestra, más evidente será la convergencia. El ejemplo de Spence Sprockets, Inc., 
demuestra el mecanismo del teorema central del límite. Comenzó con una población con 
sesgo positivo (gráfica 8-3). Después seleccionó 25 muestras aleatorias de 5 observaciones; 
calculó la media de cada muestra y, por último, organizó las 25 medias de muestra en una grá- 
fica (gráfica 8-4). Observó un cambio en la forma de la distribución muestral de las medias res- 
pecto de la de la población. El desplazamiento va de una distribución con sesgo positivo a una 
que tiene la forma de la distribución de probabilidad normal. 

Para aclarar más los efectos del teorema central del límite, incremente el número de 
observaciones en cada muestra de 5 a 20. Seleccione 25 muestras de 20 observaciones cada 
una y calcule la media de cada una de ellas. Por último, organice estas medias muéstrales 
en una gráfica (gráfica 8-5). La forma del histograma de la gráfica 8-5 se desplaza claramente 
hacia la distribución de probabilidad normal. 


8.5 Teorema central del límite 
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En el capítulo 6, la gráfica 6-3 muestra diversas distribuciones binomiales con una propor- 
ción de éxitos de 0.10, lo cual es otra demostración del teorema central del límite. Observe 
que, conforme n se incrementa de 7 a 12 y de 20 a 40, el perfil de las distribuciones de pro- 
babilidad se desplaza para acercarse cada vez más a una distribución de probabilidad normal. 
La gráfica 8-5 de la página 284 también muestra la convergencia hacia la normalidad confor- 
me n se incrementa. Esto confirma de nuevo el hecho de que, a medida que se incluyen más 
observaciones de la muestra de cualquier distribución poblacional, la forma de la distribución 
muestral de las medias se aproximará cada vez más a la distribución normal. 

El teorema central del límite mismo (lea de nuevo la definición de la página 279) no dice 
nada sobre la dispersión de la distribución muestral de medias ni sobre la comparación entre 
la media de la distribución muestral de medias y la media de la población. Sin embargo, en el 
ejemplo de Spence Sprockets hay menor dispersión en la distribución de la media muestral 
que en la distribución de la población, lo que indica la diferencia entre los rangos de la pobla- 
ción y de las medias muéstrales. Observe que la media de las medias de las muestras se 
encuentra cerca de la media de la población. Se puede demostrar que la media de la distribu- 
ción muestral es la media poblacional, es decir, que |jlx = (jl, y si la desviación estándar de la 
población es a, la desviación estándar de las medias muéstrales es o/Vn, en la que n es el 
OA6 Definir el error número de observaciones de cada muestra. Entonces, cr/Vn es el error estándar de la 

estándar de la media. media. En realidad, el nombre completo es desviación estándar de la distribución muestral de 

la media. 


ERROR ESTÁNDAR DE LA MEDIA 


(T 


( 8 - 1 ) 


Esta sección permite importantes conclusiones. 

1. La media de la distribución muestral de medias será exactamente Igual a la media pobla- 
cional si selecciona todas las muestras posibles del mismo tamaño de una población 
dada. Es decir, 

^ = M* 

Aunque no seleccione todas las muestras, es de esperar que la media de la distribución 
muestral de medias se aproxime a la media poblacional. 

2. Habrá menos dispersión en la distribución muestral de las medias que en la población. Si 
la desviación estándar de la población es ct, la desviación estándar de la distribución 
muestral de medias es o/Vn. Note que, cuando se incrementa el tamaño de la muestra, 
disminuye el error estándar de la media. 



Repase los datos de Spence Sprockets, Inc., de la página 281. Seleccione al azar 10 muestras de 5 
empleados cada una. Utilice los métodos descritos en el capítulo y la tabla de números aleatorios 
(apéndice B.6) para determinar los empleados que se incluirán en la muestra. Calcule la media de 
cada muestra y trace una gráfica de las medias muéstrales en una gráfica similar a la 8-3. ¿Cuál es 
la media de las 10 medias muéstrales? 


oormect 


Ejercicios 

11. El apéndice B.6 es una tabla de números aleatorios. De ahí que cada dígito de 0 a 9 tenga la misma 
probabilidad de presentarse. 

a) Trace una gráfica que muestre la distribución de la población. ¿Cuál es la media de la po- 
blación? 
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b) A continuación aparecen los 10 primeros renglones de cinco dígitos del apéndice B.6. 
Suponga que se trata de 1 0 muestras aleatorias de cinco valores cada una. Determine la media 
de cada muestra y trace una gráfica similar a la 8-3. Compare la media de la distribución mues- 
tral de las medias con la media poblacional. 


0 
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0 

6 

1 

5 

4 

5 

1 

7 

1 

4 

7 

1 

3 

7 

4 

8 

8 

7 

4 

5 

5 

0 

8 

9 

9 

9 

7 

8 

8 

0 

4 


12 . Scrapper Elevator Company tiene 20 representantes de ventas, que distribuyen su producto en 
Estados Unidos y Canadá. La cantidad de unidades que el mes pasado vendió cada representante 
se incluye a continuación. Suponga que estas cifras representan los valores de la población. ^ ^ 


23233424322734533335 


a) Trace una gráfica que muestre la distribución de la población. 

b) Calcule la media de la población. 

c) Seleccione cinco muestras aleatorias de 5 cada una. Calcule la media de cada muestra. Utilice 
los métodos descritos en el capítulo y en el apéndice B.6 para determinar los elementos que 
deben incluirse en la muestra. 

d) Compare la media de la distribución muestral de medias con la media poblacional. ¿Esperaría 
que los dos valores fueran aproximadamente iguales? 

e) Trace un histograma de las medias muéstrales. ¿Nota alguna diferencia en la forma de la dis- 
tribución muestral de las medias en comparación con la forma de la distribución de la pobla- 
ción? 

13. Considere que todas las monedas (un centavo, 25 centavos, etc.) que tenga en el bolsillo o mone- 
dero constituyen una población. Elabore una tabla de frecuencias, comience por el año en curso 
y cuente de manera regresiva, para registrar la antigüedad (en años) de las monedas. Por ejemplo, 
si el año en curso es 2009, una moneda que tiene impreso el año 2007 tiene dos años de antigüe- 
dad. 

a) Trace un histograma u otro tipo de gráfica que muestre la distribución de la población. 

b) Seleccione de manera aleatoria cinco monedas y registre la antigüedad media de las monedas 
seleccionadas. Repita el proceso 20 veces. Ahora trace un histograma u otro tipo de gráfica 
que muestre la distribución muestral de las medias. 

c) Compare las formas de los dos histogramas. 

14 . Considere los dígitos de los números telefónicos de una página seleccionada al azar del directo- 
rio telefónico local como una población. Elabore una tabla de frecuencias con el último dígito de 
30 números telefónicos seleccionados al azar. Por ejemplo, si el número telefónico es 5-55-97-04, 
registre un 4. 

a) Trace un histograma u otro tipo de gráfica que muestre la distribución de la población. Con la 
distribución uniforme, calcule la media de la población y la desviación estándar de la población. 

b) Registre, asimismo, la media de la muestra de los últimos cuatro dígitos (97-04 daría una 
media de 5). Ahora elabore un histograma u otro tipo de gráfica que muestre la distribución 
muestral de las medias. 

c) Compare la forma de los dos histogramas. 

8.6 Uso de la distribución muestral de la media 

El análisis anterior reviste importancia, pues la mayoría de las decisiones que se toman en los 

negocios tienen como fundamento los resultados de un muestreo. He aquí algunos ejemplos. 

1. Arm and Hammer Company desea cerciorarse de que su detergente para lavandería con- 
tiene realmente 100 onzas líquidas, como indica la etiqueta. Los registros de los procesos 
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de llenado indican que la cantidad media por recipiente es de 100 onzas líquidas y que la 
desviación estándar es de 2 onzas líquidas. A las diez de la mañana el técnico de calidad 
realiza la verificación de 40 recipientes y encuentra que la cantidad media por recipiente 
es de 99.8 onzas líquidas. ¿Debe interrumpir el proceso de llenado, o el error de muestreo 
es razonable? 

2. A.C. Nielsen Company proporciona información a las empresas que se anuncian en tele- 
visión. Las investigaciones indican que, en promedio, los adultos estadounidenses ven 
televisión 6.0 horas al día. La desviación estándar es de 1.5 horas. En el caso de una 
muestra de 50 adultos que viven en el área de Greater de Boston, ¿sería razonable selec- 
cionar al azar una muestra y encontrar que en promedio ven 6.5 horas al día? 

3. Haughton Elevator Company pretende formular especificaciones relacionadas con el 
número de personas que pueden desplazarse en un elevador nuevo de gran capacidad. 
Suponga que el peso medio de un adulto es de 160 libras, y que la desviación estándar 
es de 15 libras. Ahora bien, la distribución de pesos no sigue una distribución de proba- 
bilidad normal. Tiene un sesgo positivo. ¿Cuál es la probabilidad de que, en una muestra 
de 30 adultos, el peso medio sea de 170 o más libras? 

En cada una de estas situaciones hay una población de la cual existe determinada informa- 
ción. Se toma una muestra de esta población y se quiere saber si el error de muestreo, es 
decir, la diferencia entre el parámetro de población y la muestra estadística, se debe al azar. 
¿O la diferencia no es un error de muestreo aleatorio y, por tanto, una diferencia estadística- 
mente significativa? 

De acuerdo con los conceptos que se analizaron en la sección anterior, es posible calcu- 
lar la probabilidad de que la media de una muestra se encuentre dentro de cierto margen. La 
distribución de muestreo seguirá la distribución de probabilidad normal con dos condiciones: 

1. Cuando se sabe que las muestras se toman de poblaciones regidas por la distribución 
normal. En este caso, el tamaño de la muestra no constituye un factor. 

2. Cuando se desconoce la forma de la distribución de la población o se sabe que no es nor- 
mal, pero la muestra contiene por lo menos 30 observaciones. En este caso, el teorema 
central del límite garantiza que la distribución muestral de la media sigue una distribución 
normal. 

Aplique la fórmula (7-5) de la sección 7.5 para convertir cualquier distribución normal en 
una distribución normal estándar. A este hecho también se le denomina valor z. Así, se emplea 
la tabla de la distribución normal estándar del apéndice B.1 para determinar la probabilidad de 
seleccionar una observación que caerá dentro de un intervalo específico. La fórmula para 
determinar un valor z es: 


z = 


X - |x 

tr 


OA7 Aplicar el teorema 
central del límite para 
calcular probabilidades de 
seleccionar posibles medias 
muéstrales de una población 
específica. 


En esta fórmula, X es el valor de la variable aleatoria; p es la media de la población, y a es la 
desviación estándar de la población. 

Sin embargo, la mayor parte de las decisiones de negocios se refieren a una muestra, no 
a una sola observación. Así, lo importante es la distribución de X, la media muestral, en lugar 
de X, el valor de una observación. Éste es el primer cambio en la fórmula (7-5). El segundo 
consiste en emplear el error estándar de la media de n observaciones en lugar de la desvia- 
ción estándar de la población. Es decir, se usa ct/Vh en el denominador en vez de <x. Por con- 
siguiente, para determinar la probabilidad de una media muestral con rango específico, prime- 
ro aplique la fórmula para determinar el valor z correspondiente. Después consulte el apéndi- 
ce B.1 para localizar la probabilidad. 


CÁLCULO DEL VALOR z DE X CUANDO SE CONOCE = X - p 

LA DESVIACIÓN ESTÁNDAR DE LA POBLACIÓN Z <r/ Vn 
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El siguiente ejemplo muestra la aplicación. 


Cjemplo 


Solución 


El departamento de control de calidad de Cola, Inc., conserva registros sobre la cantidad de 
bebida de cola en su botella gigante. La cantidad real de bebida en cada botella es de primor- 
dial importancia, pero varía en una mínima cantidad entre botellas. La empresa no desea llenar 
botellas con menos líquido del debido, pues tendría problemas en lo que se refiere a la confia- 
bilidad de la marca. Por otra parte, no puede colocar líquido de más en las botellas porque 
regalaría bebida, lo cual reduciría sus utilidades. Los registros indican que la cantidad de bebi- 
da de cola tiene una distribución de probabilidad normal. La cantidad media por botella es de 
31.2 onzas, y la desviación estándar de la población, de 0.4 onzas. Hoy, a las 8 de la mañana, 
el técnico de calidad seleccionó al azar 16 botellas de la línea de llenado. La cantidad media 
de bebida en las botellas es de 31.38 onzas. ¿Es un resultado poco probable? ¿Es probable 
que el proceso permita colocar demasiada bebida en las botellas? En otras palabras, ¿es poco 
común el error de muestreo de 0.18 onzas? 

Utilice los resultados de la sección anterior para determinar la probabilidad de seleccionar una 
muestra de 1 6 (n) botellas de una población normal con una media de 31 .2 (|jl) onzas y una des- 
viación estándar de la población de 0.4 (a) onzas, y encontrar que la media muestral es de 
31.38(X). Aplique la fórmula (8-2) para determinar el valor dez. 

X - ix 31.38 - 31.20 
z = V = = — = 1 .80 

cr/Vn 0.4/V16 

El numerador de esta ecuación, X — (x = 31 .38 - 31 .20 = .1 8, es el error muestral. El deno- 
minador, cr/V/t = 0.4/V16 = 0.1 , es el error estándar de la distribución muestral de la media. 
Así, los valores z expresan el error muestral en unidades estándar; en otras palabras, el error 
estándar. 

Después, calcule la probabilidad de un valor z mayor que 1.80. En el apéndice B.1 locali- 
ce la probabilidad correspondiente a un valor z de 1.80. Este valor es de 0.4641. La probabili- 
dad de un valor z mayor que 1.80 es de 0.0359, que se calcula con la resta 0.5000 - 0.4641. 

¿Qué concluye? No es probable —menos de 4% de probabilidad— que seleccione una 
muestra de 16 observaciones de una población normal con una media de 31.2 onzas y 
una desviación estándar poblacional de 0.4 onzas, y determine que la media de la muestra es 
igual o mayor que 31 .38 onzas. La conclusión es que en el proceso se vierte demasiada bebi- 
da de cola en las botellas. El técnico de control de calidad debe entrevistarse con el supervi- 
sor de producción para sugerir la reducción de la cantidad de bebida en cada botella. La infor- 
mación se resume en la gráfica 8-6. 



GRAFICA 8-6 Distribución muestral de la cantidad media de bebida de cola en una 
botella gigante 




Resumen del capítulo 
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Autoevaluación 8-5 



Consulte la información relativa a Cola, Inc. Suponga que el técnico de control de calidad seleccio- 
nó una muestra de 16 botellas gigantes con un promedio de 31.08 onzas. ¿Qué concluye sobre el 
proceso de llenado? 


comed 


Ejercicios 

15 . Una población normal tiene una media de 60 y una desviación estándar de 12. Usted selecciona 
una muestra aleatoria de 9. Calcule la probabilidad de que la media muestral: 

a) Sea mayor que 63. 

b) Sea menor que 56. 

c) Se encuentre entre 56 y 63. 

16 . Una población normal posee una media de 75 y una desviación estándar de 5. Usted selecciona 
una muestra de 40. Calcule la probabilidad de que la media muestral: 

a) Sea menor que 74. 

b) Se encuentre entre 74 y 76. 

c) Se encuentre entre 76 y 77. 

d) Sea mayor que 77. 

17. En el sur de California, la renta de un departamento con una recámara tiene una distribución nor- 
mal con una media de $2 200 mensuales y una desviación estándar de $250 mensuales. La distri- 
bución del costo mensual no se rige por la distribución normal. De hecho, tiene un sesgo positivo. 
¿Cuál es la probabilidad de seleccionar una muestra de 50 departamentos de una recámara y 
hallar que la media es de por lo menos $1 950 mensuales? 

18 . De acuerdo con un estudio del Internal Revenue Service, los contribuyentes tardan 330 minutos 
en promedio en preparar, copiar y archivar en un medio electrónico la forma fiscal 1040. Esta dis- 
tribución de tiempos se rige por una distribución normal, y la desviación estándar es de 80 minu- 
tos. Un organismo de control selecciona una muestra aleatoria de 40 consumidores. 

a) ¿Cuál es el error estándar de la media de este ejemplo? 

b) ¿Cuál es la probabilidad de que la media de la muestra sea mayor que 320 minutos? 

c) ¿Cuál es la probabilidad de que la media de la muestra se encuentre entre 320 y 350 minutos? 

d) ¿Cuál es la probabilidad de que la media de la muestra sea superior que 350 minutos? 


Resumen del capítulo 

I. Hay muchas razones para realizar el muestreo de una población. 

A. Los resultados de una muestra permiten calcular adecuadamente el valor del parámetro pobla- 
cional, con lo cual se ahorra tiempo y dinero. 

B. Entrar en contacto con todos los miembros de la población consume demasiado tiempo. 

C. Resulta imposible verificar y localizar a todos los miembros de la población. 

D. El costo de estudiar a todos los elementos de la población resulta prohibitivo. 

E. En una prueba con frecuencia se destruye el elemento de la muestra y no se puede regresar a 
la población. 

II. En una muestra sin sesgo, todos los miembros de la población tienen la posibilidad de ser selec- 
cionados para la muestra. Existen diversos métodos de muestreo de probabilidad. 

A. En una muestra aleatoria simple, todos los miembros de la población tienen la misma posibili- 
dad de ser seleccionados para la muestra. 

B. En una muestra sistemática, se selecciona un punto de partida aleatorio y después se seleccio- 
na cada /r-ésimo elemento subsiguiente de la población para formar la muestra. 

C. En una muestra estratificada, la población se divide en varios grupos, a los que se denominan 
estratos, y en seguida se selecciona una muestra aleatoria de cada estrato. 

D. En el muestreo por conglomerados, la población se divide en unidades primarias; después se 
toman las muestras de las unidades primarias. 
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III. El error de muestreo es la diferencia entre un parámetro poblacional y un estadístico de la muestra. 

IV. La distribución muestral de la media es una distribución de probabilidad de todas las posibles 

medias muéstrales del mismo tamaño de muestra. 

A. Para un tamaño de muestra dado, la media de todas las posibles medias muéstrales tomadas 
de una población es igual a la media de la población. 

B. Existe una menor variación en la distribución de las medias muéstrales que en la distribución de 
la población. 

C. El error estándar de la media mide la variación de la distribución muestral de las medias. El error 
estándar se calcula de la siguiente manera: 

= ^ ( 8 - 1 ) 

D. Si la población se rige por una distribución normal, la distribución muestral de la media también 
se regirá por la distribución normal con muestras de cualquier tamaño. Suponga que conoce la 
desviación estándar de la población. Para determinar la probabilidad de que una media mues- 
tral caiga dentro de determinada región, se aplica la fórmula: 


z = 


X - |x 
c T/Vn 


( 8 - 2 ) 


Clave 

de pronunciación 

SÍMBOLO 

SIGNIFICADO 

Px 

Media de la distribución muestral 
de la media 

CT X 

Error estándar de la población 
de la media muestral 


PRONUNCIACIÓN 

mu subíndice X barra 

sigma subíndice X barra 


comed: 


Ejercicios del capítulo 

19 . Las tiendas de venta al menudeo en el centro comercial de North Towne Square son las siguien- 
tes: 


00 

Elder-Beerman 

09 

Lion Store 

18 

County Seat 

01 

Sears 

10 

Bootleggers 

19 

Kid Mart 

02 

Deb Shop 

11 

Formal Man 

20 

Lerner 

03 

Frederick’s of Hollywood 

12 

Leather Ltd. 

21 

Coach House Gifts 

04 

Petries 

13 

B Dalton Bookseller 

22 

Spencer Gifts 

05 

Easy Dreams 

14 

Pat’s Hallmark 

23 

CPI Photo Finish 

06 

Summit Stationers 

15 

Things Remembered 

24 

Regis Hairstylists 

07 

E. B. Brown Opticians 

16 

Pearle Vision Express 



08 

Kay-Bee Toy & Hobby 

17 

Dollar Tree 




a) Si selecciona los números aleatorios 11, 65, 86, 62, 06, 10, 12, 77 y 04, ¿con qué tiendas es 
necesario ponerse en contacto para realizar una encuesta? 
ib) Seleccione una muestra aleatoria de cuatro tiendas. Utilice el apéndice B.6. 
c) Debe aplicar un procedimiento de muestreo sistemático. Es necesario ponerse en contacto con 
la primera tienda y a continuación con cada tercer establecimiento. ¿Con qué tiendas entrará 
en contacto? 

20 . Medical Mutual Insurance investiga el costo de una visita de rutina a consultorios de médicos fami- 
liares en el área de Rochester, Nueva York. La siguiente constituye una lista de médicos familiares 
de la región. Se debe seleccionar a los médicos de forma aleatoria y establecer comunicación con 
ellos para conocer el monto de sus honorarios. Los 39 médicos se codificaron del 00 al 38. 
También se indica si cuentan con consultorio propio (P), si tienen un socio (S) o si tienen un con- 
sultorio en grupo (G). 
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Número 

Médico 

Tipo de 
consultorio 

Número 

Médico 

Tipo de 
consultorio 

00 

R. E. Scherbarth, M.D. 

P 

20 

Gregory Yost, M.D. 

S 

01 

Crystal R. Goveia, M.D. 

S 

21 

J. Christian Zona, M.D. 

S 

02 

Mark D. Hillard, M.D. 

S 

22 

Larry Johnson, M.D. 

s 

03 

Jeanine S. Huttner, M.D. 

s 

23 

Sanford Kimmel, M.D. 

s 

04 

FrancisAona, M.D. 

s 

24 

Harry Mayhew, M.D. 

p 

05 

JanetArrowsmith, M.D. 

s 

25 

Leroy Rodgers, M.D. 

p 

06 

David DeFrance, M.D. 

p 

26 

Thomas Tafelski, M.D. 

p 

07 

Judith Furlong, M.D. 

p 

27 

Mark Zilkoski, M.D. 

G 

08 

Leslie Jackson, M.D. 

G 

28 

Ken Bertka, M.D. 

G 

09 

Paul Langenkamp, M.D. 

P 

29 

Mark DeMIchiei, M.D. 

G 

10 

Philip Lepkowski, M.D. 

P 

30 

John Eggert, M.D. 

S 

11 

Wendy Martin, M.D. 

P 

31 

Jeanne Fiorito, M.D. 

S 

12 

Denny Mauricio, M.D. 

S 

32 

Michael Fitzpatrick, M.D. 

S 

13 

Hasmukh Parmar, M.D. 

S 

33 

Charles Holt, D.O. 

S 

14 

Ricardo Pena, M.D. 

S 

34 

Richard Koby, M.D. 

S 

15 

David Reames, M.D. 

S 

35 

John Meier, M.D. 

S 

16 

Ronald Reynolds, M.D. 

G 

36 

Douglas Smucker, M.D. 

P 

17 

Mark Steinmetz, M.D. 

G 

37 

David Weldy, M.D. 

S 

18 

GezaTorok, M.D. 

P 

38 

Cheryl Zaborowskl, M.D. 

S 

19 

MarkYoung, M.D. 

S 





a) Los números aleatorios que se obtuvieron del apéndice B.6 son 31 , 94, 43, 36, 03, 24, 1 7 y 09. 

¿Con qué médicos se debe establecer comunicación? 
ib) Seleccione una muestra aleatoria con los números aleatorios del apéndice B.6. 

c) La muestra debe incluir a cada quinto médico. El número 04 se selecciona como punto de par- 
tida. ¿Con qué médicos se debe establecer contacto? 

d) Una muestra debe constar de dos médicos con consultorio propio (P), dos que tienen socios 
(S) y uno con consultorio en grupo (G). Seleccione la muestra correspondiente. Explique su pro- 
cedimiento. 

21 . Una población consiste en los siguientes tres valores: 1, 2, y 3. 

a) Enumere todas las muestras posibles de tamaño 2 (incluya posibles repeticiones) y calcule la 
media de cada muestra. 

ib) Encuentre las medias de la distribución de la media muestral y la media poblacional. Compare 
ambos valores. 

c) Compare la dispersión de la población con la de la media muestral. 

d) Describa las formas de ambas distribuciones. 

22 . En el Departamento de Educación de la UR University, los registros de los estudiantes sugieren 
que la población estudiantil pasa un promedio de 5.5 horas a la semana practicando deportes 
organizados. La desviación estándar de la población es 2.2 horas a ia semana. Basándose en una 
muestra de 121 estudiantes, Healthy Lifestyles Incorporated (HLI) querría aplicar el teorema cen- 
tral del límite para realizar varias estimaciones. 

a) Calcule el error estándar de la media muestral. 

b) ¿Cuál es la probabilidad de que HLI encuentre una media muestral entre 5 y 6 horas? 

c) Calcule la probabilidad de que la media muestral esté entre 5.3 y 5.7 horas. 

d) ¿Qué tan extraño sería obtener una media muestral mayor a 6.5 horas? 

23 . El fabricante de eMachines, que manufactura una computadora económica, concluyó el diseño de 
un nuevo modelo de computadora portátil. A los altos ejecutivos de eMachines les gustaría obte- 
ner ayuda para poner precio a la nueva computadora portátil. Se solicitaron los servicios de empre- 
sas de investigación de mercados y se les pidió que prepararan una estrategia de precios. 
Marketing-Gets-Results probó las nuevas computadoras portátiles de eMachines con 50 consu- 
midores elegidos al azar, quienes indicaron que tenían planes de adquirir la computadora el año 
entrante. La segunda empresa de investigación de mercados, llamada Marketing-Reaps-Profits, 
probó en el mercado la nueva computadora portátil de eMachines con 200 propietarios de compu- 
tadoras portátiles. ¿Cuál de las pruebas de las empresas de investigación de mercados resulta la 
más útil? Explique las razones. 

24 . Responda las siguientes preguntas en uno o dos enunciados bien construidos. 

a) ¿Qué sucede con el error estándar de la media si aumenta el tamaño de la muestra? 
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ib) ¿Qué sucede con la distribución muestral de la media si aumenta el tamaño de la muestra? 
c) Cuando se utiliza la distribución de la media muestral para aproximar la media poblacional, 
¿cuál es el beneficio de utilizar tamaños muéstrales más grandes? 

25 . Hay 25 moteles en Goshen, Indiana. El número de habitaciones en cada motel es el siguiente: 


90 72 75 60 75 72 84 72 88 74 105 115 68 74 80 64 104 82 48 58 60 80 48 58 100 


a) De acuerdo con la tabla de números aleatorios (apéndice B.6), seleccione una muestra aleato- 
ria de cinco moteles de esta población. 

ib) Obtenga una muestra sistemática seleccionando un punto de partida aleatorio entre los prime- 
ros cinco moteles y después haga una selección cada quinto motel, 
c) Suponga que los últimos cinco moteles son de tarifas rebajadas. Describa la forma en que 
seleccionaría una muestra aleatoria de tres moteles normales y dos de tarifas rebajadas. 

26 . Como parte de su programa de servicio al cliente, United Airlines seleccionó de forma aleatoria a 
10 pasajeros del vuelo de hoy que parte de Chicago a Tampa a las nueve de la mañana. A cada 
pasajero de la muestra se le hará una entrevista a fondo en relación con las instalaciones, servi- 
cios, alimentos, etc., en los aeropuertos. Para identificar la muestra, a cada pasajero se le propor- 
cionó un número al abordar la nave. Los números comenzaron por 001 y terminaron en 250. 

a) Seleccione al azar 10 números con ayuda del apéndice B.6. 

ib) La muestra de 10 pudo seleccionarse con una muestra sistemática. Elija el primer número con 
ayuda del apéndice B.6 y, después, mencione los números con los que se entrevistará. 

c) Evalúe ambos métodos. Señale las ventajas y posibles desventajas. 

d) ¿De qué otra forma se puede seleccionar una muestra aleatoria de los 250 pasajeros? 

27 . Suponga que el profesor de estadística le aplicó seis exámenes durante el semestre. Usted obtu- 
vo las siguientes calificaciones (porcentaje corregido): 79, 64, 84, 82, 92 y 77. En lugar de prome- 
diar las seis calificaciones, el profesor le indicó que escogería dos al azar y calcularía el porcenta- 
je final con base en dos porcentajes. 

a) ¿Cuántas muestras de dos calificaciones se pueden tomar? 

b) Enumere todas las muestras posibles de tamaño 2 y calcule la media de cada una. 

c) Calcule la distribución muestral de la media y compárela con la media de la población. 

d) Si usted fuera estudiante, ¿le gustaría este sistema? ¿Sería diferente el resultado si se elimina- 
ra la calificación más baja? Redacte un breve informe. 

28 . En la oficina del First National Bank, ubicada en el centro de la ciudad, hay cinco cajeros automá- 
ticos. La semana pasada cada uno de los cajeros incurrió en el siguiente número de errores: 2, 3, 
5, 3 y 5. 

a) ¿Cuántas muestras de dos cajeros se pueden seleccionar? 

b) Escriba todas las muestras posibles de tamaño 2 y calcule la media de cada una. 

c) Calcule la distribución muestral de la media y compárela con la media de la población. 

29 . El departamento de control de calidad tiene cinco empleados técnicos en el turno matutino. A con- 
tinuación aparece el número de veces que cada técnico indicó al supervisor de producción que 
interrumpiera el proceso durante la última semana. 


Técnico 

Interrupciones 

Técnico 

Interrupciones 

Taylor 

4 

Rousche 

3 

Hurley 

3 

Huang 

2 

Gupta 

5 




a) ¿Cuántas muestras de dos técnicos se forman con esta población? 

ib) Enumere todas las muestras de dos observaciones que se pueden tomar y calcule la media de 
cada muestra. 

c) Compare la media de la distribución muestral de la media con la media de la población. 

d) Compare la forma de la distribución de la población con la forma de la distribución muestral de 
la media. 

30 . The Appliance Center cuenta con seis representantes de ventas en su sucursal del norte de 
Jacksonville. A continuación aparece el número de refrigeradores que vendió cada uno de ellos el 
último mes. 


Vendedor 

Refrigeradores 

vendidos 

Vendedor 

Refrigeradores 

vendidos 

Zina Craft 

54 

Jan Niles 

48 

Woon Junge 

50 

Molly Camp 

50 

Ernie DeBruI 

52 

Rachel Myak 

52 
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a) ¿Cuántas muestras de tamaño 2 se pueden tomar? 

£>) Seleccione todas las muestras posibles de tamaño 2 y calcule la cantidad media de refrigera- 
dores vendidos. 

c) Organice las medias de las muestras en una distribución de frecuencias. 

d) ¿Cuál es la media de la población? ¿Cuál es la media de las medias de la muestra? 

e) ¿Cuál es la forma de la distribución de la población? 

f) ¿Cuál es la forma de la distribución muestral de la media? 

31 . Mattel Corporation produce autos de control remoto que funcionan con baterías AA. La vida media 
de las baterías para este producto es de 35.0 horas. La distribución de las vidas de las baterías se 
aproxima a una distribución de probabilidad normal con una desviación estándar de 5.5 horas. 
Como parte de su programa, Sony prueba muestras de 25 baterías. 

a) ¿Qué se puede decir sobre la forma de la distribución muestral de ia media? 

b) ¿Cuál es el error estándar de la distribución muestral de la media? 

c) ¿Qué proporción de las muestras tendrá una media de vida útil de más de 36 horas? 

d) ¿Qué proporción de la muestra tendrá una media de vida útil mayor que 34.5 horas? 

e) ¿Qué proporción de la muestra tendrá una media de vida útil entre 34.5 y 36 horas? 

32 . CRA CDs, Inc., desea que las extensiones medias de los “cortes” de un CD sean de 135 segun- 
dos (2 minutos y 15 segundos). Esto permitirá a los disc jockeys contar con tiempo de sobra para 
“meter” comerciales entre cada segmento de 10 minutos. Suponga que la distribución de la exten- 
sión de los cortes sigue una distribución normal con una desviación estándar de la población de 
8 segundos, y también que selecciona una muestra de 16 cortes de varios CD vendidos por CRA 
CDs, Inc. 

a) ¿Qué puede decir sobre la forma de la distribución muestral de la media? 

£>) ¿Cuál es el error estándar de la media? 

c) ¿Qué porcentaje de las medias muéstrales será superior a 140 segundos? 

d) ¿Qué porcentaje de las medias muéstrales será superior a 128 segundos? 

e) ¿Qué porcentaje de las medias muéstrales será superior a 128 segundos e inferior a 140? 

33 . Estudios recientes indican que la mujer común de 50 años de edad gasta $350 anuales en pro- 
ductos de cuidado personal. La distribución de las sumas que se gastan se rige por una distribu- 
ción normal con una desviación estándar de $45 anuales. Se selecciona una muestra aleatoria de 
40 mujeres. La cantidad media que gasta dicha muestra es de $335. ¿Cuál es la probabilidad 
de hallar una media muestral igual o superior a la de la población indicada? 

34 . Información en poder del American Institute of Insurance indica que la cantidad media de seguros 
de vida por familia en Estados Unidos asciende a $1 1 0 000. Esta distribución sigue la distribución 
normal con una desviación estándar de $40 000. 

a) Si selecciona una muestra aleatoria de 50 familias, ¿cuál es el error estándar de la media? 

b) ¿Cuál es la forma que se espera que tenga la distribución muestral de la media? 

c) ¿Cuál es la probabilidad de seleccionar una muestra con una media de por lo menos $1 1 2 000? 

d) ¿Cuál es la probabilidad de seleccionar una muestra con una media de más de $100 000? 

e) Determine la probabilidad de seleccionar una muestra con una media de más de $100 000 e 
inferior a $1 12 000. 

35 . La edad media a la que los hombres se casan en Estados Unidos por primera vez se rige por la 
distribución normal con una media de 24.8 años. La desviación estándar de la distribución es de 
2.5 años. En el caso de una muestra aleatoria de 60 hombres, ¿cuál es la probabilidad de que la 
edad a la que se casaran por primera vez sea menor de 25.1 años? 

36 . Un estudio reciente que llevó a cabo la Greater Los Angeles Taxi Drivers Association mostró que 
la tarifa media por servicio de Hermosa Beach al aeropuerto internacional de Los Ángeles es de 
$21.00, y la desviación estándar, de $3.50. Seleccione una muestra de 15 tarifas. 

a) ¿Cuál es la probabilidad de que la media de la muestra se encuentre entre $20.00 y $23.00? 

b) ¿Qué debe suponer para llevar a cabo el cálculo anterior? 

37 . Crosset Trucking Company afirma que el peso medio de sus camiones cuando se encuentran 
completamente cargados es de 6 000 libras, y la desviación estándar, de 150 libras. Suponga que 
la población se rige por la distribución normal. Se seleccionan al azar 40 camiones y se pesan. 
¿Dentro de qué límites se presentará 95% de las medias de la muestra? 

38 . La cantidad media de abarrotes que compra cada cliente en Churchill Grocery Store es de $23.50, 
con una desviación estándar de $5.00. Suponga que la distribución de cantidades compradas 
sigue la distribución normal. En el caso de una muestra de 50 clientes, conteste las siguientes pre- 
guntas. 

a) ¿Cuál es la probabilidad de que la media de la muestra sea de por lo menos $25.00? 

b) ¿Cuál es la probabilidad de que la media de la muestra sea superior a $22.50 e inferior a 
$25.00? 

c) ¿Dentro de qué límites se presentará 90% de las medias muéstrales? 
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39 . La calificación media SAT de estudiantes atletas de la División I es de 947, con una desviación 
estándar de 205. Si selecciona una muestra aleatoria de 60 estudiantes, ¿cuál es la probabilidad 
de que la media se encuentre por debajo de 900? 

40 . Suponga que lanza un dado dos veces. 

a) ¿Cuántas muestras se pueden seleccionar? 

b) Enumere cada una de las muestras posibles y calcule la media. 

c) En una gráfica similar a la 8-1 , compare la distribución muestral de la media con la distribución 
de la población. 

d) Calcule la media y la desviación estándar de cada distribución y compárelas. 

41 . La siguiente tabla contiene una lista de los 50 estados asignados con los números 0 a 49. 


Número 

Estado 

Número 

Estado 

0 

Alabama 

25 

Montana 

1 

Alaska 

26 

Nebraska 

2 

Arlzona 

27 

Nevada 

3 

Arkansas 

28 

New Hampshire 

4 

California 

29 

New Jersey 

5 

Colorado 

30 

New México 

6 

Connecticut 

31 

New York 

7 

Delaware 

32 

North Carolina 

8 

Florida 

33 

North Dakota 

9 

Georgia 

34 

Ohlo 

10 

Hawai 1 

35 

Oklahoma 

11 

Idaho 

36 

Oregon 

12 

Illinois 

37 

Pennsylvania 

13 

Indiana 

38 

Rhode Island 

14 

lowa 

39 

South Carolina 

15 

Kansas 

40 

South Dakota 

16 

Kentucky 

41 

Tennessee 

17 

Louisiana 

42 

Texas 

18 

Maine 

43 

Utah 

19 

Maryland 

44 

Vermont 

20 

Massachusetts 

45 

Virginia 

21 

Michigan 

46 

Washington 

22 

Minnesota 

47 

West Virginia 

23 

Mississippi 

48 

Wisconsln 

24 

Missouri 

49 

Wyomlng 


a) Usted pretende seleccionar una muestra de ocho elementos de la lista. Los números aleatorios 
seleccionados son 45, 15, 81, 09, 39, 43, 90, 26, 06, 45, 01 y 42. ¿Qué estados se incluyen en 
la muestra? 

ib) Usted desea utilizar una muestra sistemática de cada sexto elemento y elige el dígito 02 como 
punto de partida. ¿Qué estados incluirá? 

42 . Human Resource Consulting (HRC) lleva a cabo un sondeo con una muestra de 60 empresas con 
el fin de estudiar los costos del cuidado de la salud del cliente. Uno de los elementos que se estu- 
dia es el deducible anual que deben pagar los empleados. La Bureau of Labor estatal informa que 
la media de esta distribución es de $502, con una desviación estándar de $100. 

a) Calcule el error estándar de la media muestral de HRC. 

ib) ¿Cuál es la probabilidad de que HRC encuentre una media muestral entre $477 y $527? 

c) Calcule la probabilidad de que la media muestral oscile entre $492 y $512. 

d) ¿Cuál es la probabilidad de que la media muestral sea superior a $550? 

43 . La década pasada, el número medio de miembros de la Information Systems Security Association, 
que tenían experiencia en ataques por negación de servicios cada año es de 510, con una desvia- 
ción estándar de 14.28 ataques. Suponga que nada cambia en este ambiente. 

a) ¿Cuál es la probabilidad de que este grupo sufra un promedio de más de 600 ataques los pró- 
ximos 10 años? 

ib) Calcule la probabilidad de que experimenten un promedio de entre 500 y 600 ataques durante 
los próximos 10 años. 

c) ¿Cuál es la probabilidad de que experimenten un promedio de menos de 500 ataques durante 
los próximos 10 años? 


Comandos de software 
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44 . El Oil Price Information Center informa que el precio medio por galón de gasolina normal es de 
$3.00, con una desviación estándar de población de $0.1 8. Suponga que se selecciona una mues- 
tra aleatoria de 40 estaciones de gasolina, cuyo costo medio de combustible normal se calcula. 

a) ¿Cuál es el error estándar de la media de este experimento? 

b) ¿Cuál es la probabilidad de que la media de la muestra oscile entre $2.98 y $3.02? 

c) ¿Cuál es la probabilidad de que la diferencia entre la media muestra! y la media poblacional sea 
inferior a 0.01? 

d) ¿Cuál es la probabilidad de que la media de la muestra sea superior a $3.08? 

45 . El informe anual de Nike indica que el estadounidense promedio compra 6.5 pares de zapatos 
deportivos cada año. Suponga que la desviación estándar de la población es de 2.1 y que se estu- 
diará una muestra de 81 clientes el próximo año. 

a) ¿Cuál es el error estándar de la media en este experimento? 

b) ¿Cuál es la probabilidad de que la media de la muestra se encuentre entre 6 y 7 pares de zapa- 
tos deportivos? 

c) ¿Cuál es la probabilidad de que la diferencia entre la media muestral y la media poblacional sea 
inferior a 0.25 pares? 

d) ¿Cuál es la probabilidad de que la media muestral sea superior a 7 pares? 


Ejercicios de lo base de datos 

46 . Consulte los datos de Real Estate, con información sobre las casas que se vendieron el año pasa- 
do en el área de Goodyear, Arizona. Utilice software estadístico para calcular la media y la desvia- 
ción estándar de la distribución de los precios de venta de las casas. Suponga que ésta es la 
población. Calcule la media y la desviación estándar de la muestra. Determine la probabilidad de 
encontrar una media de la muestra de este tamaño o más grande de la población. 

47 . Consulte los datos de Baseball 2009, que incluyen información sobre los 30 equipos de la Liga 
Mayor de Béisbol de la temporada 2009. En la última década, la asistencia media por equipo siguió 
una distribución normal, con una media de 2.25 millones por equipo y una desviación estándar de 
0.70 millones. Utilice un software estadístico para calcular la asistencia media por equipo durante 
la temporada 2009. Determine la probabilidad de una media muestral de este tamaño o mayor 
de la población. 

48 . Consulte los datos del Distrito Escolar Buena. La información que proporcionan los fabricantes de 
autobuses escolares sugiere que el costo medio de mantenimiento mensual es de $455 por uni- 
dad. Utilice un software estadístico para encontrar la media y la desviación estándar de los auto- 
buses de buena. ¿Los datos de Buena parecen estar alineados con los reportados por el fabrican- 
te? Específicamente, ¿cuál es la probabilidad de que la media muestral sea menor que la de 
Buena, dados los datos del fabricante? 


Comandos de software 

1. Los comandos de Excel que se requieren en la página 269 
para seleccionar una muestra aleatoria simple son los si- 
guientes: 

a) Seleccione Data en la barra de herramientas. En el extre- 
mo derecho seleccione Data Analysis y en seguida Sam- 
pling, y haga clic en OK. 

b) En el caso de Input Range, introduzca B1:B31. Como la 
columna tiene nombre, haga clic en el recuadro de 
Labels. Seleccione Random e introduzca el tamaño de la 
muestra como Number of samples, en este caso, 5. 
Haga clic en Output Range e indique el lugar de la hoja 
de cálculo en el que desea la información de la muestra. 
Observe que los resultados de su muestra diferirán de los 
del texto. Asimismo, recuerde que Excel toma muestras 
con reemplazo, así que es posible que el valor de una 
población aparezca más de una vez en la muestra. 
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Capítulo 8 


Respuestas a las autoevaluaciones 



8-1 a) Los estudiantes seleccionados son Price, Detley y 
Molter. 

b) Las respuestas varían. 

c) Saltarlo y desplazarse al siguiente número aleatorio. 
8-2 Los estudiantes seleccionados son Berry, Francis, Kopp, 

Poteau y Swetye. 

8-3 a) 10, que se calcula de la siguiente manera: 


5 ° 2 2!(5 - 2 )! 



Servicio 

Media 

muestral 

Snow, Tolson 

20, 22 

21 

Snow, Kraft 

20, 26 

23 

Snow, Irwin 

20, 24 

22 

Snow, Jones 

20, 28 

24 

Tolson, Kraft 

22, 26 

24 

Tolson, Irwin 

22, 24 

23 

Tolson, Jones 

22, 28 

25 

Kraft, Irwin 

26, 24 

25 

Kraft, Jones 

26, 28 

27 

Irwin, Jones 

24, 28 

26 


Media 

Número 

Probabilidad 

21 

1 

.10 

22 

1 

.10 

23 

2 

.20 

24 

2 

.20 

25 

2 

.20 

26 

1 

.10 

27 

1 

.10 


10 

1.00 


8-4 Las respuestas varían. A continuación aparece una solu- 
ción. 






Número de muestra 




1 

2 

3 

4 

5 

6 

7 

8 

9 

10 


8 

2 

2 

19 

3 

4 

0 

4 

1 

2 


19 

1 

14 

9 

2 

5 

8 

2 

14 

4 


8 

3 

4 

2 

4 

4 

1 

14 

4 

1 


0 

3 

2 

3 

1 

2 

16 

1 

2 

3 


2 

1 

7 

2 

19 

18 

18 

16 

3 

7 

Total 

37 

10 

29 

35 

29 

33 

43 

37 

24 

17 

X 

7.4 

2 

5.8 

7.0 

5.8 

6.6 

8.6 

7.4 

4.8 

3.4 


La media de las 10 medias muéstrales es 5.88. 


E3 

‘o 

c= 

CD 


O 

CD 

LL 



Media, años 


31.08-31.20 
8 ' 5 Z “ 0.4/V16 


- 1.20 


La probabilidad de que z sea mayor que -1 .20 es 0.5000 
+ 0.3849 = 0.8849. Existe más de 88% de probabilidad 
de que la operación de llenado produzca botellas con al 
menos 31 .08 onzas. 


d) Idénticos: la media de población, p,, es 24, y la media 
de las medias de la muestra, (jl^, también es 24. 

e) Medias muéstrales con rango de 21 a 27. Valores de 
la población de 20 a 28. 

f ) No normal. 

9) Sí. 



} 

Estimación e intervalos 
de confianza 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 


OA1 Definir un estimador 
puntual. 



La American RestaurantAssociation recopiló información sobre las 
veces que los matrimonios comen fuera de casa cada semana. Una 
encuesta de 60 parejas demostró que la cantidad media de comidas 
fuera de casa era de 2.76 por semana, con una desviación estándar 
de 0.75. Defina un intervalo de confianza de 97% para la media de la 
población. (Vea el objetivo 4 y el ejercicio 36). 


OA2 Definir nivel de 
confianza. 

OA3 Construir el intervalo de 
confianza de la media 
poblacional cuando se conoce 
la desviación estándar de la 
población. 

OA4 Construir el intervalo de 
confianza de una media 
poblacional cuando no se 
conoce la desviación estándar 
de la población. 

OA5 Construir el intervalo de 
confianza de una proporción 
de la población. 

OA6 Calcular el tamaño de la 
muestra necesario para 
estimar una proporción de la 
población o una media 
poblacional. 

OA7 Ajustar el intervalo de 
confianza de poblaciones 
finitas. 
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Estadística en acción 

En un lugar visible de la 
ventanilla de todos los 
automóviles nuevos apa- 
rece una calcomanía con 
un cálculo aproximado 
del ahorro de gasolina, 
según lo requiere la 
Environmental 
Protection Agency (EPA). 
Con frecuencia, el ahorro 
de gasolina constituye un 
factor importante para 
que el consumidor elija 
un automóvil nuevo, 
debido a los costos del 
combustible o a cuestio- 
nes ambientales. Por 
ejemplo, los cálculos 
aproximados del rendi- 
miento de combustible 
de un BMW 328i Sedán 
2010 (automático de 6 
cilindros) son de 18 
millas por galón (mpg) 
en la ciudad y de 28 mpg 
en carretera. La EPA 
reconoce que el verdade- 
ro ahorro de gasolina 
puede diferir de los 
cálculos aproximados: 
“Ninguna prueba puede 
simular todas las combi- 
naciones de condiciones 
y clima posibles, del 
comportamiento del con- 
ductor y hábitos en el 
cuidado del automóvil. 

El millaje real depende 
de cómo, cuándo y 
dónde se maneje el ve- 
hículo. La EPA descubrió 
que las mpg que obtiene 
la mayoría de los conduc- 
tores difieren de los 
cálculos aproximados por 
unas cuantas mpg.” De 
hecho, la calcomanía del 
parabrisas también inclu- 
ye una estimación del 
intervalo relativo al aho- 
rro de combustible: 14 a 

22 mpg en ciudad y de 

23 a 33 mpg en carretera. 



9.1 Introducción 

En el capítulo anterior se inició el estudio de la estadística inferencial. En él se presentaron las 
razones y métodos de muestreo. Las razones del muestreo son las siguientes: 

• Entrar en contacto con toda la población consume demasiado tiempo. 

• El costo de estudiar todos los elementos de la población es muy alto. 

• Por lo general, los resultados de la muestra resultan adecuados. 

• Algunas pruebas resultan negativas. 

• Es imposible revisar todos los elementos. 

Existen varios métodos de muestreo. El aleatorio simple es el que más se utiliza. En este 
tipo de muestreo, cada miembro de la población posee las mismas posibilidades de ser selec- 
cionado como parte de la muestra. Otros métodos de muestreo son el sistemático, el estrati- 
ficado y el muestreo por conglomerados. 

El capítulo 8 presenta información relacionada con la media, la desviación estándar o la 
forma de la población. En la mayoría de las situaciones de negocios, dicha información no se 
encuentra disponible. En realidad, el propósito del muestreo es calcular de forma aproximada 
algunos de estos valores. Por ejemplo, se selecciona una muestra de una población y se uti- 
liza la media de la muestra para aproximar la media de la población. 

En este capítulo se estudian diversos aspectos Importantes del muestreo. El primer paso 
es el estudio del estimador puntual. Un estimador puntual consiste en un solo valor (punto) 
deducido de una muestra para estimar el valor de una población. Por ejemplo, suponga que 
elige una muestra de 50 ejecutivos de nivel medio y le pregunta a cada uno de ellos la cantidad 
de horas que laboró la semana pasada. Se calcula la media de esta muestra de 50 y se utiliza 
el valor de la media muestral como estimador puntual de la media poblaclonal desconocida. 
Ahora bien, un estimador puntual es un solo valor. Un enfoque que arroja más información con- 
siste en presentar un Intervalo de valores del que se espera que se estime el parámetro pobla- 
cional. Dicho intervalo de valores recibe el nombre de intervalo de confianza. 

En los negocios, a menudo es necesario determinar el tamaño de una muestra. ¿Con 
cuántos electores debe ponerse en contacto una compañía dedicada a realizar encuestas con 
el fin de predecir los resultados de las elecciones? ¿Cuántos productos se necesitan analizar 
para garantizar el nivel de calidad? En este capítulo también se explica una estrategia para 
determinar el tamaño adecuado de la muestra. 

9.2 Estimadores puntuales e intervalos 
de confianza de una media 

Un estimador puntual es un estadístico único para calcular un parámetro poblacional. 
Suponga que Best Buy, Inc., desea estimar la edad media de los compradores de televisores 
de plasma de alta definición; selecciona una muestra aleatoria de 50 compradores recientes, 
determina la edad de cada uno de ellos y calcula la edad media de los compradores de la 
muestra. La media de esta muestra es un estimador puntual de la media de la población. 


ESTIMADOR PUNTUAL Estadístico calculado a partir de información de la muestra para estimar 
el parámetro poblacional. 


Los siguientes ejemplos ¡lustran los estimadores puntuales de medias poblacionales. 

1. El turismo constituye una fuente Importante de Ingresos para muchos países caribeños, 
como Barbados. Suponga que la Oficina de Turismo de Barbados desea un cálculo apro- 
ximado de la cantidad media que gastan los turistas que visitan el país. No resultaría via- 
ble ponerse en contacto con cada turista. Por consiguiente, se selecciona al azar a 500 
turistas en el momento en que salen del país y se les pregunta los detalles de los gastos 
que realizaron durante su visita a la isla. La cantidad media que gastó la muestra de 500 
turistas constituye un cálculo aproximado del parámetro poblacional desconocido. Es 
decir, la media muestral es el estimador puntual de la media poblaclonal. 
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OA1 Definir un estimador 2. Litchfield Home Builders, Inc., construye casas en la zona sureste de Estados Unidos. Una 
puntual. de las principales preocupaciones de los compradores es la fecha en que concluirán las 

obras. Hace poco Litchfield comunicó a sus clientes: “Su casa quedará terminada en 45 
días a partir de la fecha de instalación de los muros.” El departamento de atención a clien- 
tes de Litchfield desea comparar este ofrecimiento con experiencias recientes. Una mues- 
tra de 50 casas terminadas este año reveló que el número medio de días de trabajo a partir 
del inicio de la construcción de los muros a la terminación de la casa fue de 46.7 días hábi- 
les. ¿Es razonable concluir que la media poblacional aún es de 45 días y que la diferencia 
entre la media muestral (46.7 días) y la media de población propuesta es un error de mues- 
treo? En otras palabras, ¿la media muestral difiere en forma significativa de la media 
poblacional? 



3. Estudios médicos recientes indican que el ejercicio constituye una parte 
importante de la salud general de una persona. El director de recursos 
humanos de OCF, fabricante importante de vidrio, desea calcular la can- 
tidad de horas semanales que los empleados dedican al ejercicio. Una 
muestra de 70 empleados revela que la cantidad media de horas de ejer- 
cicio de la semana pasada fue de 3.3. La media muestral de 3.3 horas 
aproxima la media poblacional desconocida, la media de horas de ejerci- 
cio de todos los empleados. 

La media muestral, X, no es el único estimador puntual de un parámetro 
poblacional. Por ejemplo, p, una proporción muestral, es un estimador puntual 
de tt, la proporción poblacional; y s, la desviación estándar muestral, es un 
estimador puntual de o-, la desviación estándar poblacional. 


9.3 Intervalos de confianza de una 
media poblacional 

Ahora bien, un estimador puntual sólo dice parte de la historia. Aunque se espera que el esti- 
mador puntual se aproxime al parámetro poblacional, sería conveniente medir cuán próximo 
se encuentra en realidad. Un intervalo de confianza sirve para este propósito. Por ejemplo, se 
estima que el ingreso anual medio de los trabajadores de la construcción en el área de Nueva 
York a Nueva Jersey es de $85 000. Un intervalo de este valor aproximado puede oscilar entre 
$81 000 y $89 000. Para describir cuánto es posible confiar en que el parámetro poblacional 
se encuentre en el intervalo se debe generar un enunciado probabilístico. Por ejemplo: se 
cuenta con 90% de seguridad de que el ingreso anual medio de los trabajadores de la cons- 
trucción en el área de Nueva York a Nueva Jersey se encuentra entre $81 000 y $89 000. 


OA2 Definir nivel de 
confianza. 


INTERVALO DE CONFIANZA Conjunto de valores que se forma a partir de una muestra de datos 
de forma que exista la posibilidad de que el parámetro poblacional ocurra dentro de dicho 
conjunto con una probabilidad específica. La probabilidad específica recibe el nombre de 
^nivel de confianza. ^ 


Para calcular el intervalo de confianza, consideraremos dos situaciones: 

• Utilizamos los datos de la muestra para calcular pu con X, mientras que la desviación 
estándar de la población (ct) es conocida. 

• Utilizamos los datos de la muestra para calcular pu con X, mientras que la desviación están- 
dar de la población es desconocida. En este caso, sustituimos la desviación estándar de 
la(s) muestra(s) por la desviación estándar de la población (ct). 

Existen diferencias importantes en las suposiciones entre estas dos situaciones. Considera- 
remos primero el caso donde se conoce a. 
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Desviación estándar de la población 
conocida (o-) 

Un intervalo de confianza se calcula con el empleo de dos estadísticos: la media muestral X y 
la desviación estándar. De los capítulos anteriores, usted sabe que la desviación estándar es 
un estadístico importante, porque mide la dispersión, o la amplitud, de una población o de una 
muestra de distribución. Cuando se calcula un intervalo de confianza, se utiliza la desviación 
estándar para estimar el rango del intervalo de confianza. 

Para demostrar la ¡dea del intervalo de confianza, se comienza con una suposición sim- 
ple: que conocemos el valor de la desviación estándar de la población, a. Conocerla permite 
simplificar el desarrollo del intervalo de confianza, porque podemos utilizar la distribución nor- 
mal estándar que se estudió en el capítulo 8. 

Recuerde que la distribución muestral de la media es la distribución de todas las medias 
muéstrales, X, con tamaño de la muestra, n, de una población. Se conoce la desviación están- 
dar de la población, <x. A partir de esta información, y del teorema central del límite, sabemos 
que la distribución muestral sigue una distribución de probabilidad normal con una media |x y 
una desviación estándar a/ Vñ. Recuerde también que este valor recibe el nombre de error 
estándar. 

Los resultados del teorema central del límite permiten afirmar lo siguiente con respecto a 
los intervalos de confianza utilizando el estadístico z: 

1 . Noventa y cinco por ciento de las medias muéstrales seleccionadas de una población se 
encontrará dentro de 1 .96 errores estándares (desviación estándar de las medias mués- 
trales de la media poblacional, jjl. 

2. Noventa y nueve por ciento de las medias muéstrales se encontrará a 2.58 errores están- 
dares de la media poblacional. 

Los intervalos calculados de esta manera proporcionan ejemplos de los niveles de confianza 
y reciben el nombre de intervalo de confianza de 95% e intervalo de confianza de 99%. Por 
lo tanto, 95% y 99% son los niveles de confianza y se refieren al porcentaje de intervalos simi- 
larmente construidos que incluirían el parámetro a calcular, en este caso, jjl. 

¿Cómo se obtienen los valores de 1 .96 y 2.58? En el caso del intervalo de confianza de 
95%, vea el siguiente diagrama y consulte el apéndice B.1 para determinar los valores z ade- 
cuados. Localice 0.4750 en el cuerpo de la tabla. Lea los valores del renglón y la columna 
correspondientes. El valor es 1.96. Por lo tanto, la probabilidad de hallar un valor z entre 0 y 
1.96 es de 0.4750. Asimismo, la probabilidad de encontrar un valor z en el intervalo entre 0 
y - 1 .96 también es de 0.4750. Al combinar ambos valores, la probabilidad de estar en el inter- 
valo — 1.96 y 1.96 es de 0.9500. En la siguiente página encontrará una porción del apéndice 
B.1. El valor z del nivel de confianza de 90% se determina de forma similar. Éste es de 1.65. 
En el caso de un nivel de confianza de 99%, el valor z es de 2.58. 
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z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

1.5 

0.4332 

0.4345 

0.4357 

0.4370 

0.4382 

0.4394 

0.4406 

0.4418 

0.4429 

0.4441 

1.6 

0.4452 

0.4463 

0.4474 

0.4484 

0.4495 

0.4505 

0.4515 

0.4525 

0.4535 

0.4545 

1.7 

0.4554 

0.4564 

0.4573 

0.4582 

0.4591 

0.4599 

0.4608 

0.4616 

0.4625 

0.4633 

1.8 

0.4641 

0.4649 

0.4656 

0.4664 

0.4671 

0.4678 

0.4686 

0.4693 

0.4699 

0.4706 

1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 

0.4750 

0.4756 

0.4761 

0.4767 

2.0 

0.4772 

0.4778 

0.4783 

0.4788 

0.4793 

0.4798 

0.4803 

0.4808 

0.4812 

0.4817 

2.1 

0.4821 

0.4826 

0.4830 

0.4834 

0.4838 

0.4842 

0.4846 

0.4850 

0.4854 

0.4857 

2.2 

0.4861 

0.4864 

0.4868 

0.4871 

0.4875 

0.4878 

0.4881 

0.4884 

0.4887 

0.4890 

2.3 

0.4893 

0.4896 

0.4898 

0.4901 

0.4904 

0.4906 

0.4909 

0.491 1 

0.4913 

0.4916 

2.4 

0.4918 

0.4920 

0.4922 

0.4925 

0.4927 

0.4929 

0.4931 

0.4932 

0.4934 

0.4936 


OA3 Construir el intervalo 
de confianza de la media 
poblacional cuando se 
conoce la desviación 
estándar de la población. 


¿Cómo determinar el intervalo de confianza de 95%? La amplitud del intervalo se deter- 
mina por medio del nivel de confianza y de la magnitud del error estándar de la media. Ya se 
ha descrito la forma de encontrar el valor z de un nivel de confianza particular. Recuerde que, 
según el capítulo anterior [vea la fórmula (8-1), p. 285], el error estándar de la media indica la 
variación de la distribución de las medias muéstrales. Se trata, en realidad, de la desviación 
estándar de la distribución muestral de medias. La fórmula se repite en seguida: 


CT 



donde: 

tr- es el símbolo del error estándar de la media; se utiliza la letra griega porque se trata de 
un valor poblacional, y el subíndice x recuerda que se refiere a la distribución de las 
medias muéstrales. 

ct es la desviación estándar poblacional. 
n es el número de observaciones en la muestra. 


La magnitud del error estándar se ve afectada por dos valores. El primero es la desviación 
estándar de la población. Mientras mayor sea la desviación estándar de la población, a, mayor 
será cr/Vñ. Si la población es homogénea, de modo que genere una desviación estándar 
poblacional pequeña, el error estándar también será pequeño. Sin embargo, la cantidad de 
observaciones de la muestra también afecta al error estándar. Una muestra grande generará 
un error estándar pequeño en la estimación, lo que indicará que hay menos variabilidad en las 
medias muéstrales. 

Para explicar estos conceptos, considere el siguiente ejemplo. Del Monte 
Foods, Inc., distribuye duraznos en trozo en latas de 4 onzas. Para asegurarse 
de que cada lata contenga por lo menos la cantidad que se requiere, Del Monte 
establece que el proceso de llenado debe verter 4.01 onzas de duraznos y 
almíbar en cada lata. Así, 4.01 es la media poblacional. Por supuesto, no toda 
lata contendrá exactamente 4.01 onzas de duraznos y almíbar. Algunas latas 
contendrán más y otras menos. Suponga que la desviación estándar del pro- 
ceso es de 0.04 onzas. También suponga que el proceso se rige por la distri- 
bución de probabilidad normal. Ahora se selecciona una muestra aleatoria de 
64 latas y se determina la media de la muestra. Ésta es de 4.015 onzas de 
duraznos y almíbar. El intervalo de confianza de 95% de la media poblacional 
de esta muestra particular es: 

4.015 ± 1 ,96(.04/V64) = 4.015 ± .0098 

El nivel de confianza de 95% se encuentra entre 4.0052 y 4.0248. Por supuesto, en este 
caso, la media de población de 4.01 onzas se encuentra en este intervalo. Pero no siempre 
será así. En teoría, si selecciona 100 muestras de 64 latas de la población, se calcula la media 
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muestral y se crea un intervalo de confianza basado en cada media muestra/, se esperaría 
encontrar una media poblacional de aproximadamente 95 de los 1 00 intervalos. 

Los siguientes cálculos en el caso de un intervalo de confianza de 95% se resumen con 
la siguiente fórmula: 


X ± 1 .96 -^7= 

Vn 

De manera similar, un intervalo de confianza de 99% se calcula de la siguiente manera: 

X ± 2.58 

Vn 

Como ya se señaló, los valores de 1.96 y 2.58 son valores z correspondientes a 95% 
medio y 99% medio de las observaciones, respectivamente. 

No hay restricción a los niveles de confianza de 95 y 99%. Es posible seleccionar cual- 
quier nivel de confianza entre 0 y 100% y encontrar el valor correspondiente dez. En general, 
un intervalo de confianza de la media poblacional, cuando se conoce la desviación estándar 
poblacional, se calcula de la siguiente manera: 


INTERVALO DE CONFIANZA DE LA MEDIA 
POBLACIONAL CON UNA <r CONOCIDA 


X ± z 


(T 


(9-1) 


En esta fórmula, z depende del nivel de confianza. Por consiguiente, con un nivel de con- 
fianza de 92%, el valorz en la fórmula (9-1) es de 1 .75. El valor dez proviene del apéndice B.1 . 
Esta tabla se basa en la mitad de la distribución normal, por lo que 0.9200/2 = 0.4600. El valor 
más próximo en el cuerpo de la tabla es de 0.4599, y el valor z correspondiente es de 1 .75. 

Con frecuencia, también se utiliza el nivel de confianza de 90%. En este caso, se desea 
que el área entre 0 y z sea de 0.4500, que se determina con la operación 0.9000/2. Para deter- 
minar el valorz con este nivel de confianza, descienda por la columna izquierda del apéndice 
B.1 hasta 1.6, y después recorra las columnas con los encabezamientos 0.04 y 0.05. El área 
correspondiente al valorz de 1.64 es 0.4495, y de 1.65, 0.4505. Para proceder con cautela, 
utilice 1.65. Intente buscar los siguientes niveles de confianza y verifique sus respuestas con 
los valores correspondientes de z indicados a la derecha. 


Nivel de 
confianza 

Probabilidad 
media más cercana 

Valor 

z 

80% 

.3997 

1.28 

94% 

.4699 

1.88 

96% 

.4798 

2.05 


El siguiente ejemplo muestra los detalles para calcular un intervalo de confianza e inter- 
preta el resultado. 


Cjemplo 


Solución 


La American Management Association desea información acerca del ingreso medio de los 
gerentes de la industria del menudeo. Una muestra aleatoria de 256 gerentes revela una media 
muestral de $45 420. La desviación estándar de esta muestra es de $2 050. A la asociación le 
gustaría responder las siguientes preguntas: 

1. ¿Cuál es la media de la población? 

2. ¿Cuál es un conjunto de valores razonable de la media poblacional? 

3. ¿Cómo se deben interpretar estos resultados? 

En general, las distribuciones de los salarios e ingresos tienen un sesgo positivo, pues unos 
cuantos individuos ganan considerablemente más que otros, lo cual sesga la distribución en 
dirección positiva. Por fortuna, el teorema central del límite estipula que, si se selecciona una 
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muestra grande, la distribución de las medias muéstrales tenderá a seguir la distribución nor- 
mal. En este caso, una muestra de 256 gerentes es lo bastante grande para suponer que la dis- 
tribución muestral tenderá a seguir la distribución normal. A continuación se responden las 
preguntas planteadas en el ejemplo. 

1. ¿Cuál es la media de la población? En este caso se ignora. Sí se sabe que la media de 
la muestra es de $45 420. De ahí que la mejor estimación del valor de población sea el 
estadístico de la muestra correspondiente. Por consiguiente, la media de la muestra de 
$45 420 constituye un estimador puntual de la media poblacional desconocida. 

2. ¿Cuál es el conjunto de valores razonable de la media poblacional? La asociación 
decide utilizar un nivel de confianza de 95%. Para determinar el intervalo de confianza 
correspondiente, se aplica la fórmula (9-1): 



Es costumbre redondear estos puntos extremos a $45 169 y $45 671. Estos puntos extre- 
mos reciben el nombre de límites de confianza. El grado de confianza o nivel de confianza 
es de 95%, y el intervalo de confianza abarca de $45 169 a $45 671. Con frecuencia, 
±$251 se conoce como margen de error. 

3. ¿Cómo se deben interpretar estos resultados? Suponga que selecciona varias mues- 
tras de 256 gerentes, tal vez varios cientos. Para cada muestra, calcula la media y des- 
pués construye un intervalo de confianza de 95%, como en la sección anterior. Puede 
esperar que alrededor de 95% de estos intervalos de confianza contenga la media de la 
población. Cerca de 5% de los intervalos no contendrán el ingreso anual medio poblacio- 
nal, (i,. No obstante, un intervalo de confianza particular contiene el parámetro poblacional 
o no lo contiene. El siguiente diagrama muestra los resultados de seleccionar muestras de 
la población de gerentes de la industria del menudeo: se calcula la media de cada una y, 
posteriormente, con la fórmula (9-1), se determina un intervalo de confianza de 95% de la 
media poblacional. Observe que no todos los intervalos incluyen la media poblacional. Los 
dos puntos extremos de la quinta muestra son inferiores a la media poblacional. Esto se 
debe al error de muestreo, que constituye el riesgo que se asume cuando se selecciona el 
nivel de confianza. 



Escala de X 




Muestra 1 de tamaño 256. 
Incluye la media de la población. 
Muestra 2 de tamaño 256. 
Incluye la media de la población. 


Muestra 3 de tamaño 256. 




■*6 

Media de la población 


Xa 


Incluye la media de la población. 
Muestra 4 de tamaño 256. 

Incluye la media de la población. 

Muestra 5 de tamaño 256. 

No incluye la media de la población. 
Muestra 6 de tamaño 256. 

Incluye la media de la población. 
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Simulación por computadora 

Con ayuda de una computadora es posible seleccionar al azar muestras de una población, 
calcular con rapidez el intervalo de confianza y mostrar la frecuencia con que los Intervalos de 
confianza incluyen, aunque no siempre, el parámetro de la población. El siguiente ejemplo 
aclarará esta cuestión. 


Cjemplo 



Tras varios años en el negocio de renta de automóviles, Town Bank sabe que la distancia media 
recorrida en un contrato de cuatro años es de 50 000 millas, y la desviación estándar, de 5 000. 
Suponga que desea encontrar la proporción de los intervalos de confianza de 95% que inclui- 
rán la media poblacional de 50 000 con el sistema de software de estadística de Minitab. Para 
facilitar los cálculos, trabaje en miles de millas, en lugar de unidades de milla. Seleccione 60 
muestras aleatorias de tamaño 30 de una población con una media de 50, y una desviación 
estándar de 5. 


Los resultados de 60 muestras aleatorias de 30 automóviles cada una se resumen en la cap- 
tura de pantalla que aparece a continuación. De los 60 intervalos de confianza con un nivel de 
confianza de 95%, 2% o 3.33% no incluyen la media poblacional de 50. Se resaltan los inter- 
valos (C3 y C59) que no incluyen la media poblacional. Con la cifra de 3.33% se aproxima al 
cálculo de que 5% de los intervalos no incluirán la media poblacional, y que 58 de 60, es decir, 
96.67%, se aproxima a 95 por ciento. 

Para explicar el primer cálculo con mayor detalle, Minitab comienza con la selección de 
una muestra aleatoria de 30 observaciones de una población con una media de 50 y una des- 
viación estándar de 5. La media de estas 30 observaciones es de 50.053. El error muestral es 
de 0.053, que se determina por medio de X — |x = 50.053 — 50.000. Los puntos extremos 
del intervalo de confianza son 48.264 y 51.842. Estos puntos extremos se determinan con la 
fórmula (9-1): 


X ± 1 .96 -* 7 = = 50.053 ± 1 .96 -%= = 50.053 ± 1 .789 
Vñ V30 


One-Sample Z: 


The assumed sigma = 5 


Variable 

N 

Mean 

StDev 

SE Mean 

95 . 0% 

CI 

C1 

30 

50 . 053 

5 . 002 

0.913 

( 48.264, 

51 . 842) 

C2 

30 

49 . 025 

4 .450 

0.913 

( 47.236, 

50 . 815) 

C3 

30 

52 . 023 

5 . 918 

0 . 913 

( 50.234, 

53.812) 

C4 

30 

50 . 056 

3.364 

0 . 913 

( 48.267, 

51 . 845) 

C5 

30 

49 . 737 

4 . 784 

0.913 

( 47.948, 

51.526) 

C6 

30 

51 . 074 

5.495 

0.913 

( 49.285, 

52.863) 

C7 

30 

50 . 040 

5 . 930 

0 . 913 

( 48.251, 

51 . 829) 

C8 

30 

48 . 910 

3 . 645 

0 . 913 

( 47.121, 

50 . 699) 

C9 

30 

51.033 

4 . 918 

0.913 

( 49.244, 

52.822) 

CIO 

30 

50 .692 

4 . 571 

0.913 

( 48.903, 

52 .482) 

Cll 

30 

49 . 853 

4 . 525 

0 . 913 

( 48.064, 

51 . 642) 

C12 

30 

50.286 

3.422 

0 . 913 

( 48.497, 

52 . 076) 

C13 

30 

50.257 

4 .317 

0.913 

( 48.468, 

52 . 046) 

C14 

30 

49.605 

4 . 994 

0.913 

( 47.816, 

51 . 394) 

C15 

30 

51.474 

5.497 

0 . 913 

( 49.685, 

53.264) 

C16 

30 

48 . 930 

5.317 

0 . 913 

( 47.141, 

50 . 719) 

C17 

30 

49 . 870 

4 . 847 

0.913 

( 48.081, 

51 . 659) 

C18 

30 

50.739 

6.224 

0.913 

( 48.950, 

52 . 528) 

C19 

30 

50 . 979 

5 . 520 

0 . 913 

( 49.190, 

52 . 768) 

C2 0 

30 

48 . 848 

4 . 130 

0 . 913 

( 47.059, 

50 . 638) 

C21 

30 

49.481 

4 . 056 

0.913 

( 47.692, 

51.270) 

C22 

30 

49 . 183 

5.409 

0.913 

( 47.394, 

50 . 973) 

C23 

30 

50 . 084 

4 . 522 

0 . 913 

( 48.294, 

51 . 873) 

C24 

30 

50 . 866 

5 . 142 

0 . 913 

( 49.077, 

52 . 655) 

C25 

30 

48 . 768 

5.582 

0.913 

( 46.979, 

50 . 557) 

C26 

30 

50 . 904 

6 . 052 

0.913 

( 49.115, 

52 . 694) 

C27 

30 

49.481 

5.535 

0 . 913 

( 47.691, 

51 .270) 

C2 8 

30 

50 . 949 

5 . 916 

0 . 913 

( 49.160, 

52 . 739) 
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Variable 

N 

Mean 

StDev 

SE Mean 

95 . 0% 

CI 

C2 9 

30 

49 . 106 

4 . 641 

0 . 913 

( 47.317, 

50.895) 

C30 

30 

49 . 994 

5 . 853 

0.913 

( 48.205, 

51.784) 

C31 

30 

49.601 

5 . 064 

0.913 

( 47.811, 

51 .390) 

C32 

30 

51.494 

5 . 597 

0.913 

( 49.705, 

53.284) 

C33 

30 

50.460 

4.393 

0.913 

( 48.671, 

52.249) 

C34 

30 

50.378 

4 . 075 

0 . 913 

( 48.589, 

52.167) 

C35 

30 

49 . 808 

4 . 155 

0.913 

( 48.019, 

51 . 597) 

C36 

30 

49 . 934 

5 . 012 

0.913 

( 48.145, 

51.723) 

C37 

30 

50 . 017 

4 . 082 

0.913 

( 48.228, 

51.806) 

C38 

30 

50 . 074 

3.631 

0 . 913 

( 48.285, 

51.863) 

C39 

30 

48 . 656 

4 . 833 

0.913 

( 46.867, 

50.445) 

C4 0 

30 

50.568 

3 . 855 

0.913 

( 48.779, 

52.357) 

C41 

30 

50 . 916 

3 . 775 

0.913 

( 49.127, 

52 .705) 

C42 

30 

49 . 104 

4.321 

0 . 913 

( 47.315, 

50.893) 

C43 

30 

50.308 

5.467 

0.913 

( 48.519, 

52 . 097) 

C44 

30 

49 . 034 

4.405 

0.913 

( 47.245, 

50.823) 

C45 

30 

50.399 

4 . 729 

0 . 913 

( 48.610, 

52.188) 

C46 

30 

49.634 

3 . 996 

0 . 913 

( 47.845, 

51.424) 

C47 

30 

50.479 

4 . 881 

0 . 913 

( 48.689, 

52.268) 

C4 8 

30 

50.529 

5 . 173 

0.913 

( 48.740, 

52.318) 

C49 

30 

51 . 577 

5 . 822 

0.913 

( 49.787, 

53.366) 

C50 

30 

50.403 

4 . 893 

0 . 913 

( 48.614, 

52.192) 

C51 

30 

49 . 717 

5.218 

0.913 

( 47.927, 

51.506) 

C52 

30 

49 . 796 

5.327 

0 . 913 

( 48.007, 

51 . 585) 

C53 

30 

50 . 549 

4 . 680 

0 . 913 

( 48.760, 

52.338) 

C54 

30 

50.200 

5 . 840 

0 . 913 

( 48.410, 

51.989) 

C55 

30 

49 . 138 

5 . 074 

0 . 913 

( 47.349, 

50.928) 

C56 

30 

49 . 667 

3 . 843 

0.913 

( 47.878, 

51.456) 

C57 

30 

49.603 

5 . 614 

0 . 913 

( 47.814, 

51.392) 

C58 

30 

49.441 

5 . 702 

0 . 913 

( 47.652, 

51.230) 

C59 

30 

47 . 873 

4 . 685 

0 . 913 

( 46.084, 

49.662) 

C60 

30 

51 . 087 

5 . 162 

0 . 913 

( 49.297, 

52.876) 


r 


Autoevaluación 


9-1 



Bun-and-Run es una franquicia de comida rápida de la zona noreste, la cual se especializa en ham- 
burguesas de media onza, y sándwiches de pescado y de polio. También ofrece refrescos y papas 
a la francesa. El departamento de planeación de la firma informa que la distribución de ventas dia- 
rias de los restaurantes tiende a seguir la distribución normal. La desviación estándar de la distribu- 
ción de ventas diarias es de $3 000. Una muestra de 40 mostró que las ventas medias diarias 
suman $20 000. 

a) ¿Cuál es la media de la población? 

tí) ¿Cuál es la mejor estimación de la media de la población? ¿Qué nombre recibe este valor? 

c) Construya un intervalo de confianza de 99% de la media poblacional. 

d) Interprete el intervalo de confianza. 


comed 


Ejercicios 

1. Se toma una muestra de 49 observaciones de una población normal con una desviación estándar 
de 10. La media de la muestra es de 55. Determine el intervalo de confianza de 99% de la media 
poblacional. 

2. Se toma una muestra de 81 observaciones de una población normal con una desviación estándar 
de 5. La media de la muestra es de 40. Determine el intervalo de confianza de 95% de la media 
poblacional. 

3. Se selecciona una muestra de 250 observaciones de una población normal en ia cual la desvia- 
ción estándar poblacional se sabe que es de 25. La media de la muestra es de 20. 

a) Determine el error estándar de la media. 

b) Explique por qué se debe utilizar la fórmula (9-1) para determinar el intervalo de confianza de 
95 por ciento. 

c) Determine el intervalo de confianza de 95% de la media de la población. 

4. Suponga que desea un nivel de confianza de 85%. ¿Qué valor utilizaría para multiplicar el error 
estándar de la media? 

5. Una empresa de investigación llevó a cabo una encuesta para determinar la cantidad media que 
los fumadores gastan en cigarrillos durante una semana. La empresa descubrió que la distribución 
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de cantidades que gastan por semana tendía a seguir una distribución normal, con una desviación 
estándar de $5. Una muestra de 49 fumadores reveló que X = $20. 

a) ¿Cuál es el estimador puntual de la media de la población? Explique lo que indica. 

b) Con el nivel de confianza de 95%, determine el intervalo de confianza de (x. Explique lo que 
significa. 

6. Repase el ejercicio anterior. Suponga que se tomó una muestra de 64 fumadores (en lugar de 49). 
Suponga que la media muestral es la misma. 

a) ¿Cuál es el estimador del intervalo de confianza de 95% de fx? 

b) Explique por qué este intervalo de confianza es más reducido que el que se determinó en el 
ejercicio anterior. 

7. Bob Nale es propietario de Nale’s Quick Fill. A Bob le gustaría estimar la cantidad de galones de 
gasolina que vendió. Suponga que la cantidad de galones vendidos tiende a seguir una distribu- 
ción normal, con una desviación estándar de 2.30 galones. De acuerdo con sus registros, selec- 
ciona una muestra aleatoria de 60 ventas y descubre que la cantidad media de galones vendidos 
es de 8.60. 

a) ¿Cuál es el estimador puntual de la media poblacional? 

b) Establezca un intervalo de confianza de 99% de la media poblacional. 

c) Interprete el significado del inciso b). 

8. La doctora Patton es profesora de inglés. Hace poco contó el número de faltas de ortografía que 
cometió un grupo de estudiantes en sus ensayos. Observó que la distribución de las faltas de orto- 
grafía por ensayo se regía por la distribución normal con una desviación estándar de 2.44 palabras 
por ensayo. En su clase de 40 alumnos de las 10 de la mañana, el número medio de palabras con 
faltas de ortografía fue de 6.05. Construya un intervalo de confianza de 95% del número medio de 
palabras con faltas de ortografía en la población de ensayos. 


Desviación estándar poblacional a desconocida 

OA4 Construir el intervalo 
de confianza de una media 
poblacional cuando no se 
conoce la desviación 
estándar de la población. 


• El decano de la Facultad de Administración desea estimar la cantidad media de horas de 
estudiantes de tiempo completo con trabajos remunerativos cada semana. Selecciona 
una muestra de 30 estudiantes; se pone en contacto con cada uno de ellos y les pregun- 
ta cuántas horas laboraron la semana pasada. De acuerdo con la información de la mues- 
tra, puede calcular la media muestral, pero no es probable que conozca o pueda deter- 
minar la desviación estándar poblacional (a) que se requiere en la fórmula (9-1). Puede 
calcular la desviación estándar de la muestra y utilizarla como estimador, pero quizá no 
conocería la desviación estándar de la población. 

• La docente a cargo del asesoramlento de los estudiantes desea estimar la distancia que 
el estudiante común viaja cada día de su casa a clases. Ella selecciona una muestra de 
40 estudiantes, se pone en contacto con ellos y determina la distancia que recorre cada 
uno, de su casa al centro universitario. De acuerdo con los datos de la muestra, calcula la 
distancia media de viaje, es decir X. No es probable que se conozca o se encuentre dis- 
ponible la desviación estándar de la población, lo cual, nuevamente, torna obsoleta la 
fórmula (9-1). 

• El director de créditos estudiantiles desea conocer el monto medio de créditos estudian- 
tiles en el momento de la graduación. El director selecciona una muestra de 20 estu- 
diantes graduados y se pone en contacto con cada uno para obtener la Información. De 
acuerdo con la Información con la que cuenta, puede estimar la cantidad media. Sin 
embargo, para establecer un intervalo de confianza con la fórmula (9-1), es necesaria la 
desviación estándar de la población. No es probable que esta información se encuentre 
disponible. 


En la sección anterior se supuso que se conocía la desviación estándar de la población. En el 
caso de las latas de duraznos de 4 onzas de Del Monte, quizá había una gran cantidad de 
mediciones del proceso de llenado. Por consiguiente, resulta razonable suponer que se dis- 
pone de la desviación estándar de la población. Sin embargo, en la mayoría de los casos de 
muestreo, no se conoce la desviación estándar de la población (a). He aquí algunos ejemplos 
en los que se pretende estimar las medias poblacionales y es poco probable que se conozcan 
las desviaciones estándares. Suponga que cada uno de los siguientes estudios se relaciona 
con estudiantes de la West Virginia University. 
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Estadística en acción 

William Gosset nació en 
Inglaterra en 1876 y 
murió allí en 1937. 
Trabajó muchos años en 
Arthur Guinness, Sons 
and Conrpany. En reali- 
dad, en sus últimos años 
estuvo a cargo de 
Guiness Brewery en 
Londres. Guinness prefe- 
ría que sus empleados 
utilizaran seudónimos 
cuando publicaban traba- 
jos, de modo que, en 
1908, cuando Gosset 
escribió “The Probable 
Error of a Mean”, utilizó 
el nombre de Student. 

En este artículo describió 
por primera vez las pro- 
piedades de la distribu- 
ción t. 



Por fortuna, se utiliza la desviación estándar de la muestra para estimar la desviación es- 
tándar poblacional. Es decir, se utiliza s, la desviación estándar de la muestra, para estimar ct, 
la desviación estándar de la población. No obstante, al hacerlo no es posible utilizar la fórmu- 
la (9-1). Como no conoce o-, no puede utilizar la distribución z. Sin embargo, hay una solución: 
utilizar la desviación estándar de la media y sustituir la distribución z con la distribución t. 

La distribución t es una distribución de probabilidad continua, con muchas características 
similares a las de la distribución z. William Gosset, experto cervecero, fue el primero en estu- 
diar la distribución t. 

Estaba especialmente interesado en el comportamiento exacto de la distribución del 
siguiente estadístico: 


, _ x- n 
s/Vn 

Aquí, s es un estimador de ct. Le preocupaba en particular la discrepancia entre s y ct cuando 
s se calculaba a partir de una muestra muy pequeña. La distribución f y la distribución normal 
estándar se muestran en la gráfica 9-1 . Observe que la distribución f es más plana y que se 
extiende más que la distribución normal estándar. Esto se debe a que la desviación estándar 
de la distribución t es mayor que la distribución normal estándar. 



GRÁFICA 9-1 


Distribución normal estándar y distribución í de Student 


Las siguientes características de la distribución f se basan en el supuesto de que la pobla- 
ción de interés es de naturaleza normal, o casi normal. 

• Como en el caso de la distribución z, es una distribución continua. 

• Como en el caso de la distribución z, tiene forma de campana y es simétrica. 

• No existe una distribución t, sino una familia de distribuciones t. Todas las distribuciones 
t tienen una media de 0, y sus desviaciones estándares difieren de acuerdo con el tama- 
ño de la muestra, n. Existe una distribución t para un tamaño de muestra de 20, otro para 
un tamaño de muestra de 22, etc. La desviación estándar de una distribución t con 5 
observaciones es mayor que en el caso de una distribución t con 20 observaciones. 

• La distribución t se extiende más y es más plana por el centro que la distribución normal 
estándar (vea la gráfica 9-1). Sin embargo, conforme se incrementa el tamaño de la mues- 
tra, la distribución t se aproxima a la distribución normal estándar, pues los errores que se 
cometen al utilizar s para estimar ct disminuyen con muestras más grandes. 

Como la distribución t de Student posee mayor dispersión que la distribución z, el valor de t 
en un nivel de confianza dado tiene una magnitud mayor que el valor z correspondiente. La 
gráfica 9-2 muestra los valores de z para un nivel de confianza de 95% y de t para el mismo 
nivel de confianza cuando el tamaño de la muestra es de n = 5. En breve se explicará la forma 
como se obtuvo el valor real de t. Por el momento, observe que, con el mismo nivel de con- 
fianza, la distribución t es más plana o más amplia que la distribución normal estándar. 
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Distribución de z 



Distribución de í 



GRÁFICA 9-2 Valores de z y t para el nivel de confianza de 95 por ciento 


Para crear un intervalo de confianza de la media poblacional con la distribución f, se ajus- 
ta la fórmula (9-1) de la siguiente manera. 


INTERVALO DE CONFIANZA DE LA MEDIA - s 

POBLACIONAL CON <t DESCONOCIDA X ± f Vñ 


(9-2) 


y 


Para crear un intervalo de confianza de la media poblacional con una desviación estándar 
desconocida: 

1. Suponga que la población muestreada es normal o aproximadamente normal. De acuer- 
do con el teorema central del límite, sabemos que este supuesto es cuestionable en el 
caso de muestras pequeñas, y es más válida en el de muestras más grandes. 

2. Estime la desviación estándar de la población (a) con la desviación estándar de la mues- 
tra (s). 

3. Utilice la distribución t en lugar de la distribución z. 

Cabe hacer una aclaración en este momento. La decisión de utilizar f o z se basa en el hecho 
de que se conozca a, la desviación estándar poblacional. Si se conoce, se utiliza z. Si no se 
conoce, se debe utilizar t. La gráfica 9-3 resume el proceso de toma de decisión. 

El siguiente ejemplo ¡lustra un Intervalo de confianza de una media poblacional cuando no 
se conoce la desviación estándar de la población y para determinar el valor apropiado de t en 
una tabla. 
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GRÁFICA 9-3 Cómo determinar cuándo se debe usar la distribución z o la distribución t 


Cjemplo 


Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de 10 
llantas que recorrieron 50 000 millas reveló una media muestral de 0.32 pulgadas de cuerda 
restante con una desviación estándar de 0.09 pulgadas. Construya un intervalo de confian- 
za de 95% de la media poblacional. ¿Sería razonable que el fabricante concluyera que des- 
pués de 50 000 millas la cantidad media poblacional de cuerda restante es de 0.30 pulgadas? 


Solución 


Para comenzar, se supone que la distribución de la población es normal. En este caso no hay 
muchas evidencias, pero tal vez la suposición sea razonable. No se conoce la desviación 
estándar de la población, pero sí la desviación estándar de la muestra, que es de 0.09 pulga- 
das. Se aplica la fórmula (9-2): 



X ± t 


Vn 


De acuerdo con la información dada, X = 0.32, s = 0.09 y n = 10. Para hallar el valor de t, uti- 
lice el apéndice B.2, una parte del cual se reproduce en la tabla 9-1. El primer paso para loca- 
lizar f consiste es desplazarse a lo largo de las columnas identificadas como “Intervalos de 


TABLA 9-1 Una parte de la distribución t 


Intervalos de confianza 


80% 

90% 

95% 

98% 

99% 



Nivel de significancia de una prueba de una cola 


9l 

0.10 

0.05 

0.025 

0.010 

0.005 



Nivel de significancia de una prueba de dos colas 



0.20 

0.10 

0.05 

0.02 

0.01 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

9 

1.383 

1.833 

1 2 . 262 | 

2.821 

3.250 

10 

1.372 

1.812 

2.228 

2.764 

3.169 
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confianza” hasta el nivel de confianza que se requiere. En este caso, desea el nivel de confian- 
za de 95%, así que vaya a la columna con el encabezamiento “95%”. La columna del margen 
izquierdo se identifica como “gl”. Estas palabras se refieren al número de grados de libertad, 
esto es, el número de observaciones incluidas en la muestra menos el número de muestras, el 
cual se escribe n - 1. En este caso es de 10 - 1 = 9. ¿Por qué se decidió que había 9 gra- 
dos de libertad? Cuando se utilizan estadísticas de la muestra, es necesario determinar el 
número de valores que se encuentran libres para variar. 

Para ilustrarlo, suponga que la media de cuatro números es de 5. Los cuatro números son 
7, 4, 1 y 8. Las desviaciones respecto de la media de estos números deben sumar 0. Las des- 
viaciones de +2, —1, -4 y +3 suman 0. Si se conocen las desviaciones de +2, -1 y -4, el 
valor de +3 se fija (se restringe) con el fin de satisfacer la condición de que la suma de las des- 
viaciones debe totalizar 0. Por consiguiente, 1 grado de libertad se pierde en un problema de 
muestreo que implique la desviación estándar de la muestra, pues se conoce un número (la 
media aritmética). En el caso de un nivel de confianza de 95% y 9 grados de libertad, selec- 
cione la fila con 9 grados de libertad. El valor de t es 2.262. 

Para determinar el intervalo de confianza se sustituyen los valores en la fórmula (9-2): 


X ± f —7= = 0.32 ± 2.262 
Vn 


0.09 

Vio 


0.32 ± .064 


Los puntos extremos del intervalo de confianza son 0.256 y 0.384. ¿Cómo interpretar este 
resultado? Si repitiéramos este estudio 200 veces, calculando el intervalo de confianza de 95% 
con cada media de la muestra y la desviación estándar, 1 90 intervalos incluirían la media pobla- 
cional. Diez intervalos no la incluirían. Éste es el efecto del error muestral. Otra interpretación 
es concluir que la media poblacional se encuentra en este intervalo. El fabricante puede estar 
seguro (95% seguro) de que la profundidad media de las cuerdas oscila entre 0.256 y 0.384 
pulgadas. Como el valor de 0.30 se encuentra en este intervalo, es posible que la media de la 
población sea de 0.30 pulgadas. 


He aquí otro ejemplo para explicar el uso de los intervalos de confianza. Suponga que un 
artículo publicado en el periódico local indica que el tiempo medio para vender una residencia 
de la zona es de 60 días. Usted selecciona una muestra aleatoria de 20 residencias que se 
vendieron en el último año y encuentra que el tiempo medio de venta es de 65 días. De acuer- 
do con los datos de la muestra, crea un intervalo de confianza de 95% de la media de la pobla- 
ción. Usted descubre que los puntos extremos son 62 y 68 días. ¿Cómo interpreta este 
resultado? Puede confiar de manera razonable en que la media poblacional se encuentre den- 
tro de este intervalo. El valor propuesto para la media poblacional, es decir, 60 días, no se 
incluye en el intervalo. No es probable que la media poblacional sea de 60 días. La evidencia 
indica que la afirmación del periódico local puede no ser correcta. En otras palabras, parece 
poco razonable obtener la muestra que usted tomó de una población que tenía un tiempo de 
venta medio de 60 días. 

El siguiente ejemplo mostrará detalles adicionales para determinar e interpretar el interva- 
lo de confianza. Se usó Minitab para realizar los cálculos. 


Cjemplo 


El gerente de Inlet Square Malí, cerca de Ft. Myers, Florida, desea estimar la cantidad media 
que gastan los clientes que visitan el centro comercial. Una muestra de 20 clientes revela las 
siguientes cantidades. 


$48.16 

$42.22 

$46.82 

$51.45 

$23.78 

$41 .86 

$54.86 

37.92 

52.64 

48.59 

50.82 

46.94 

61.83 

61.69 

49.17 

61.46 

51.35 

52.68 

58.84 

43.88 



¿Cuál es la mejor estimación de la media poblacional? Determine un intervalo de confianza de 
95%. Interprete el resultado. ¿Concluiría de forma razonable que la media poblacional es 
de $50? ¿Y de $60? 
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Solución 





El gerente del centro comercial supone que la población de las can- 
tidades gastadas sigue la distribución normal. En este caso es una 
suposición razonable. Además, la técnica del Intervalo de confian- 
za resulta muy poderosa y tiende a consignar cualquier error del 
lado conservador si la población no es normal. No cabe suponer 
una condición normal cuando la población se encuentra pronuncia- 
damente sesgada o cuando la distribución tiene colas gruesas. En 
el capítulo 18 se exponen métodos para manejar este problema en 
caso de que no sea posible suponer una condición normal. En 
este caso, resulta razonable suponer una condición normal. 

No se conoce la desviación estándar de la población. De ahí 
que resulte adecuado utilizar la distribución t y la fórmula (9-2) para 
encontrar el intervalo de confianza. Se utiliza el software Minitab 
para hallar la media y la desviación estándar de esta muestra. Los 
resultados aparecen a continuación. 
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El gerente del centro comercial no conoce la media poblacional. La media muestral cons- 
tituye la mejor aproximación de dicho valor. De acuerdo con la captura de pantalla de Minitab, 
la media es de $49.35, que constituye la mejor aproximación, la estimación puntual, de la 
media poblacional desconocida. 

Se aplica la fórmula (9-2) para determinar el intervalo de confianza. El valor de t se locali- 
za en el apéndice B.2. Hay n-1 =20-1 =19 grados de libertad. Al desplazarse por el ren- 
glón con 19 grados de libertad a la columna del intervalo de confianza de 95%, el valor de esta 
intersección es de 2.093. Se sustituyen estos valores en la fórmula 9-2 para encontrar el inter- 
valo de confianza. 

«* s $9.01 

X ± t — 7 = = $49.35 ± 2.093 ^ 7 =- = $49.35 ± $4.22 
Vn V20 

Los puntos extremos del intervalo de confianza son $45.13 y $53.57. Resulta razonable con- 
cluir que la media poblacional se encuentra en dicho intervalo. 

El gerente de Inlet Square se preguntaba si la media poblacional podría haber sido $50 o 
$60. El valor de $50 se encuentra dentro del intervalo de confianza. Resulta razonable que la 
media poblacional sea de $50. El valor de $60 no se encuentra en el intervalo de confianza. De 
ahí que se concluya que no es probable que la media poblacional sea de $60. 


Los cálculos para construir un intervalo de confianza también se encuentran disponibles 
en Excel. La captura de pantalla aparece a continuación. Observe que la media de la muestra 
($49.35) y la desviación estándar de la muestra ($9.01) son las mismas que en los cálculos de 
Minitab. En la información de Excel, el último renglón de la salida también incluye el margen 
de error, que es la cantidad que se suma y se resta de la media muestral para formar los pun- 
tos extremos del intervalo de confianza. Este valor se determina a partir de la expresión 


f-^= = 2.093 

Vn 


$9.01 

V20 


$4.22 
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Dottie Kleman es la “Cookie Lady”. Hornea y vende galletas en 50 lugares del área de Filadelfia. La 
señora Kleman está interesada en el ausentismo de sus trabajadoras. La siguiente información se 
refiere al número de días de ausencias de una muestra de 10 trabajadoras durante el último periodo 
de pago de dos semanas. 


4 1 2 2 1 2 2 1 0 3 


a) Determine la media y la desviación estándar de la muestra. 

b) ¿Cuál es la media de la población? ¿Cuál es la mejor estimación de dicho valor? 

c) Construya un intervalo de confianza de 95% de la media poblacional. 

d) Explique la razón por la que se utiliza la distribución t como parte del intervalo de confianza. 

e) ¿Es razonable concluir que la trabajadora común no falta ningún día durante un periodo de 
pago? 


oomect 


Ejercicios 

9. Utilice el apéndice B.2 para localizar el valor t en las siguientes condiciones. 

a) El tamaño de la muestra es de 12, y el nivel de confianza, de 95 por ciento. 

b) El tamaño de la muestra es de 20, y el nivel de confianza, de 90 por ciento. 

c) El tamaño de la muestra es de 8, y el nivel de confianza, de 99 por ciento. 

10. Utilice el apéndice B.2 para localizar el valor de t en las siguientes condiciones. 

a) El tamaño de la muestra es de 15, y el nivel de confianza, de 95 por ciento. 

b) El tamaño de la muestra es de 24, y el nivel de confianza, de 98 por ciento. 

c) El tamaño de la muestra es de 12, y el nivel de confianza, de 90 por ciento. 

11. El propietario de Britten’s Egg Farm desea calcular la cantidad media de huevos que pone cada 
gallina. Una muestra de 20 gallinas indica que ponen un promedio de 20 huevos al mes, con una 
desviación estándar de 2 huevos al mes. 

a) ¿Cuál es el valor de la media de la población? ¿Cuál es el mejor estimador de este valor? 

b) Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer? 

c) ¿Cuál es el valor de t en un intervalo de confianza de 95%? 

d) Construya el intervalo de confianza de 95% de la media de población. 

e) ¿Es razonable concluir que la media poblacional es de 21 huevos? ¿Y de 25 huevos? 
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12. La industria estadounidense de lácteos desea calcular el consumo medio de leche por año. Una 
muestra de 16 personas revela que el consumo medio anual es de 60 galones, con una desviación 
estándar de 20 galones. 

a) ¿Cuál es el valor de la media poblacional? ¿Cuál es el mejor estimador de este valor? 

b) Explique por qué necesita utilizar la distribución t. ¿Qué suposiciones necesita hacer? 

c) ¿Cuál es el valor de t en un intervalo de confianza de 90%? 

d) Construya el intervalo de confianza de 90% de la media de población. 

e) ¿Es razonable concluir que la media poblacional es de 63 galones? 

13. Merrill Lynch Securities y Health Care Retirement, Inc., son dos grandes empresas ubicadas en el 
centro de Toledo, Ohio. Contemplan ofrecer de forma conjunta servicio de guardería para sus 
empleados. Como parte del estudio de viabilidad del proyecto, desean calcular el costo medio 
semanal por el cuidado de los niños. Una muestra de 10 empleados que recurren al servicio de 
guardería revela las siguientes cantidades gastadas la semana pasada. 


$107 $92 $97 $95 $105 $101 $91 $99 $95 $104 


Construya el intervalo de confianza de 90% de la media poblacional. Interprete el resultado. 

14. Greater Pittsburgh Area Chamber of Commerce desea calcular el tiempo medio que los trabajado- 
res que laboran en el centro de la ciudad utilizan para llegar al trabajo. Una muestra de 15 traba- 
jadores revela las siguientes cantidades de minutos de viaje. 


29 

38 

38 

33 

38 

21 

45 

34 

40 

37 

37 

42 

30 

29 

35 



Construya el intervalo de confianza de 98% de la media poblacional. Interprete el resultado. 


OA5 Construir el inten/alo 
de confianza de una 
proporción de la población. 


9.4 Intervalo de confianza de una proporción 

El material hasta ahora expuesto en este capítulo utiliza la 
escala de medición de razón. Es decir, se emplean varia- 
bles como ingresos, pesos, distancias y edades. Ahora se 
considerarán casos como los siguientes: 

• El director de servicios profesionales de Southern 
Technical Institute informa que 80% de sus gradua- 
dos entra en el mercado laboral en un puesto relacio- 
nado con su área de estudio. 

• Un representante de ventas afirma que 45% de las 
ventas de Burger King se lleva a cabo en la ventana 
de servicio para automóviles. 

• Un estudio de las casas del área de Chicago indicó 
que 85% de las construcciones nuevas cuenta con 
sistema de aire acondicionado central. 

• Una encuesta reciente entre hombres casados de 
entre 35 y 50 años de edad descubrió que 63% creía 
que ambos cónyuges deben aportar dinero. 

Estos ejemplos ilustran la escala de medición nomi- 
nal. Cuando se mide con una escala nominal, una obser- 
vación se clasifica en uno de dos o más grupos mutuamente excluyentes. Por ejemplo, un 
graduado de Southern Tech entra al mercado laboral en un puesto relacionado con su campo 
de estudio o no lo hace. Un consumidor de Burger King hace una compra en la ventana de 
servicio para automóviles o no. Sólo hay dos posibilidades, y el resultado debe clasificarse en 
uno de los dos grupos. 
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Estadística en acción 

Los resultados de muchas 
encuestas que aparecen 
en periódicos, revistas de 
noticias y televisión utili- 
zan intervalos de confian- 
za. Por ejemplo, una 
encuesta reciente de 800 
televidentes de Toledo, 
Ohio, reveló que 44% 
observaba las noticias de 
la noche en la estación 
local afiliada a CBS. El 
artículo también indicó 
que el margen de error 
fue de 5.4%. El margen 
de error es, en realidad, 
la cantidad que se suma y 
resta del estimador pun- 
tual para determinar los 
puntos extremos de un 
intervalo de confianza. 

De acuerdo con la fórmu- 
la (9-4) y el nivel de con- 
fianza de 95 por ciento: 


P(l-P) 


= 1.96 


= 0.034 


.44(1 - .44) 


800 


PROPORCIÓN Fracción, razón o porcentaje que indica la parte de la muestra de la población 
que posee un rasgo de interés particular. 


Como ejemplo de proporción, una encuesta reciente indicó que 92 de cada 100 entrevis- 
tados estaban de acuerdo con el horario de verano para ahorrar energía. La proporción de la 
muestra es de 92/100, o 0.92, o 92%. Si p representa la proporción de la muestra, X el núme- 
ro de éxitos y n el número de elementos de la muestra, se determina una proporción muestral 
de la siguiente manera: 


r 


PROPORCION MUESTRAL 


V 





(9-3) 


y 


La proporción de la población se define por medio de ir. Por consiguiente, tt se refie- 
re al porcentaje de éxitos en la población. Recuerde, del capítulo 6, que tt es la proporción 
de éxitos en una distribución binomial. Esto permite continuar la práctica de utilizar letras grie- 
gas para identificar parámetros de población y letras latinas para identificar estadísticas mués- 
trales. 

Para crear el intervalo de confianza de una proporción, es necesario cumplir con los 
siguientes supuestos: 

1. Las condiciones binomiales, estudiadas en el capítulo 6, han quedado satisfechas. En 

resumen, estas condiciones son: 

a) Los datos de la muestra son resultado de conteos. 

b) Sólo hay dos posibles resultados (lo normal es referirse a uno de los resultados como 
éxito y al otro como fracaso). 

c) La probabilidad de un éxito permanece igual de una prueba a la siguiente. 

d) Las pruebas son independientes. Esto significa que el resultado de la prueba no influ- 
ye en el resultado de otra. 

2. Los valores mr y n(1 - tt) deben ser mayores o iguales que 5. Esta condición permite recu- 
rrir al teorema central del límite y emplear la distribución normal estándar, es decir, z, para 

completar un intervalo de confianza. 

El desarrollo del estimador puntual de la proporción de la población y el intervalo de con- 
fianza de una proporción de población es similar a hacerlo para una media. Para ilustrarlo, 
considere lo siguiente: John Gail es candidato para representar al tercer distrito de Nebraska 
ante el Congreso. De una muestra aleatoria de 100 electores en el distrito, 60 indican que pla- 
nean votar por él en las próximas elecciones. La proporción de la muestra es de 0.60, pero no 
se conoce la proporción poblacional. Es decir, no se conoce qué proporción de electores de 
la población votará por Gail. El valor de la muestra, 0.60, es el mejor estimador del parámetro 
poblacional desconocido. Así, p, que es de 0.60, constituye un estimador de tt, que no se 
conoce. 

Para crear el intervalo de confianza de una proporción de población se aplica la fórmula: 


f 



INTERVALO DE CONFIANZA DE LA 
PROPORCIÓN DE UNA POBLACIÓN 


(9-4) 

V 

J 


Un ejemplo ayudará a explicar los detalles para determinar un intervalo de confianza y el 
resultado. 
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Cjemplo 


Solución 


El sindicato que representa a Bottle Blowers of America (BBA) considera la propuesta de fusión 
con Teamsters Union. De acuerdo con el reglamento del sindicato de BBA, por lo menos tres 
cuartas partes de los miembros del sindicato deben aprobar cualquier fusión. Una muestra 
aleatoria de 2 000 miembros actuales de BBA revela que 1 600 planean votar por la propues- 
ta. ¿Qué es el estimador de la proporción poblacional? Determine el intervalo de confianza de 
95% de la proporción poblacional. Fundamente su decisión en esta información de la mues- 
tra: ¿puede concluir que la proporción necesaria de miembros del BBA favorece la fusión? 
¿Por qué? 


Primero calcule la proporción de la muestra de acuerdo con la fórmula (9-3). Ésta es de 0.80, 
que se calcula de la siguiente manera: 


P = 


X 

n 


1 600 
2 000 


= .80 


Por consiguiente, se calcula que 80% de la población favorece la propuesta de fusión. Deter- 
mine el intervalo de confianza de 95% con ayuda de la fórmula (9-4). El valor z correspondien- 
te al nivel de confianza de 95% es de 1.96. 


p ±z 


P(1 - P) 


= .80 ± 1.96 


.80(1 - .80) 
2 000 


.80 ± .018 


Los puntos extremos del intervalo de confianza son 0.782 y 0.81 8. El punto extremo más bajo 
es mayor que 0.75. Así, es probable que se apruebe la propuesta de fusión, pues el estimador 
del intervalo incluye valores superiores a 75% de los miembros del sindicato. 


Un repaso de la interpretación del Intervalo de confianza: si la encuesta fue aplicada 1 00 veces 
con 100 muestras distintas, los intervalos de confianza construidos a partir de 95 de las mues- 
tras contendrán la verdadera proporción de la población. Además, la interpretación de un 
intervalo de confianza resulta de mucha utilidad en la toma de decisiones, y desempeña 
un papel muy importante en especial la noche de las elecciones. Por ejemplo, Cliff Obermeyer 
se postula para representar ante el Congreso al 6o. distrito de Nueva Jersey. Suponga que se 
entrevista a los electores que acaban de votar y 275 indican que votaron por Obermeyer. 
Considere que 500 electores es una muestra aleatoria de quienes votan en el 6o. distrito. Esto 
significa que 55% de los electores de la muestra votó por Obermeyer. De acuerdo con la 
fórmula (9-3): 


P = 


X 

n 


275 

500 


= .55 


Ahora, para estar seguros de la elección, Obermeyer debe ganar más de 50% de los votos 
de la población de electores. En este momento se conoce un estimador puntual, que es de 
0.55, de la población de electores que votarán por él. Ahora bien, no se conoce el porcentaje 
de la población que votará por el candidato. En estas circunstancias, la pregunta es: ¿es posi- 
ble tomar una muestra de 500 electores de una población en la que 50% o menos de los elec- 
tores apoye a Obermeyer para encontrar que 55% de la muestra lo apoya? En otras palabras, 
¿el error de muestreo, que es p - tt = .55 - .50 = .05, se debe al azar, o la población de elec- 
tores que apoya a Obermeyer es superior a 0.50? Si se establece el intervalo de confianza de 
la proporción de la muestra y halla que 0.50 no se encuentra en el intervalo, concluirá que la 
proporción de electores que apoya a Obermeyer es mayor que 0.50. ¿Qué significa esto? Bien, 
significa que puede resultar electo. ¿Qué pasa si 0.50 pertenece al intervalo? Entonces con- 
cluirá que es posible que 50% o menos de los electores apoyen su candidatura y no es posi- 
ble concluir que será electo a partir de de la información de la muestra. En este caso, si se 
utiliza el nivel de significancia de 95% y la fórmula (9-4), se tiene que: 


p±z 


p( 1 ~ P) 


.55 ± 1.96 



.55 ± .044 
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Así, los puntos extremos del intervalo de confianza son: 0.55, -0.044 = 0.506 y 0.55 + 
0.044 = 0.594. El valor de 0.50 no pertenece al intervalo. Por lo tanto, se concluye que 
probablemente más de 50% de los electores apoya a Obermeyer, lo cual es suficiente para 
que sea elegido. 

¿Siempre se utiliza este procedimiento? Sí. Es exactamente el procedimiento de las cade- 
nas de televisión, revistas de noticias y sondeos en la noche de las elecciones. 




Autoevaluación 


9-3 



Se llevó a cabo una encuesta de mercado para calcular la proporción de amas de casa que recono- 
cerían el nombre de la marca de un limpiador a partir de la forma y color del envase. De las 1 400 
amas de casa de la muestra, 420 identificaron la marca por su nombre, 

a) Calcule el valor de la proporción de la población. 

tí) Construya el intervalo de confianza de 99% de la proporción poblacional. 
c) Interprete sus conclusiones. 


comed 


Ejercicios 

15. El propietario de West End Kwick Fill Gas Station desea determinar la proporción de clientes que 
utilizan tarjeta de crédito o débito para pagar la gasolina en el área de las bombas. Entrevistó a 
100 clientes y descubre que 80 pagaron en ella. 

a) Calcule el valor de la proporción de la población. 

b ) Construya el intervalo de confianza de 95% de la proporción poblacional. 

c) Interprete sus conclusiones. 

16. Maria Wilson considera postularse para la alcaldía de la ciudad de Bear Gulch, Montana. Antes de 
solicitar la postulación, decide realizar una encuesta entre los electores de Bear Gulch. Una mues- 
tra de 400 electores revela que 300 la apoyarían en las elecciones de noviembre. 

a) Calcule el valor de la proporción de la población. Calcule el error estándar de la proporción. 

b) Construya el intervalo de confianza de 99% de la proporción poblacional. 

c) Interprete sus resultados. 

17. La televisora Fox TV considera reemplazar uno de sus programas de investigación ciminal, que se 
transmite durante las horas de mayor audiencia, por una nueva comedia orientada a la familia. 
Antes de tomar una decisión definitiva, los ejecutivos estudian una muestra de 400 telespectado- 
res. Después de ver la comedia, 250 afirmaron que la verían y sugirieron reemplazar el programa 
de investigación criminal. 

a) Calcule el valor de la proporción de la población. 

b) Construya el intervalo de confianza de 99% de la proporción poblacional. 

c) Interprete los resultados que obtuvo. 

18. Schadek Silkscreen Printing, Inc., compra tazas de plástico para imprimir en ellas logotipos de 
eventos deportivos, graduaciones, cumpleaños u otras ocasiones importantes. Zack Schadek, el 
propietario, recibió un envío grande esta mañana. Para asegurarse de la calidad del envío, selec- 
cionó una muestra aleatoria de 300 tazas. Halló que 15 estaban defectuosas. 

a) ¿Cuál es la proporción aproximada de tazas defectuosas en la población? 

b) Construya el intervalo de confianza de 95% de la proporción de tazas defectuosas. 

c) Zack llegó con su proveedor al acuerdo de que devolverá lotes con 10% o más de artículos 
defectuosos. ¿Debe devolver este lote? Explique su decisión. 


9.5 Elección del tamaño adecuado de una muestra 


Una variable importante cuando se trabaja con intervalos de confianza es el tamaño de la 
muestra. Sin embargo, en la práctica, no es una variable, sino una decisión que se toma 
para que la estimación del parámetro de población sea bueno. Esta decisión se basa en tres 
OA6 Calcular el tamaño de variables: 
la muestra necesario para 

estimar una proporción de la 1 . El margen de error que tolerará el investigador, 

población o una media 2. El nivel de confianza deseado. 

poblacional. 3. La variabilidad o dispersión de la población que se estudia. 
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La primera variable es el margen de error. El máximo error admisible, designado E, es la 
magnitud que se suma y resta de la media muestral (o proporción muestral) para determi- 
nar los puntos extremos del intervalo de confianza. Por ejemplo, en un estudio de salarios, 
podemos decidir que deseamos estimar el salario promedio de la población con un margen 
de error de más o menos $1 000. O en una encuesta de opinión, podemos decidir que desea- 
mos calcular la proporción de la población con un margen de error de más o menos 5%. 
El margen de error es la magnitud del error que se tolerará al estimar un parámetro pobla- 
cional. Quizás se pregunte por qué no elegir márgenes pequeños de error. Existe una compen- 
sación entre el margen de error y el tamaño de la muestra. Un margen de error pequeño 
requiere de una muestra más grande y de más tiempo y dinero para recolectarla. Un margen 
de error más grande permitirá tener una muestra más pequeña y un intervalo de confianza más 
amplio. 

La segunda elección es el nivel de confianza. Al trabajar con un intervalo de confianza, 
lógicamente se elegirán niveles de confianza relativamente altos como de 95 y 99%, que son 
los más comunes. Para calcular el tamaño de la muestra, se necesitará un estadístico z 
que corresponda al nivel de confianza elegido. El nivel de confianza de 95% corresponde al 
valor z de 1 .96, y el nivel de confianza de 99%, a un valor z de 2.58. Note que las muestras 
más grandes (con su consecuente requerimiento de más tiempo y dinero para recolectarlas) 
corresponden a niveles de confianza más altos. Asimismo, observe que utilizamos un estadís- 
tico z. 

El tercer factor en la determinación del tamaño de una muestra es la desviación estándar 
de la población. Si la población se encuentra muy dispersa, se requiere una muestra grande. 
Por el contrario, si se encuentra concentrada (homogénea), el tamaño de muestra que se 
requiere será menor. No obstante, puede ser necesario utilizar un estimador de la desviación 
estándar de la población. He aquí algunas sugerencias para determinar dicho estimador. 

1 . Realice un estudio piloto. Éste es el método más común. Suponga que desea un cálcu- 
lo aproximado de la cantidad de horas que trabajan a la semana los estudiantes matricu- 
lados en la Facultad de Administración de la University of Texas. Para probar la validez del 
cuestionario, se aplica a una pequeña muestra de estudiantes. A partir de esta pequeña 
muestra se calcula la desviación estándar de la cantidad de horas que trabajan y se utili- 
za este valor como la desviación estándar de la población. 

2. Utilice un estudio comparativo. Aplique este enfoque cuando se encuentre disponible 
un estimador de la dispersión de otro estudio. Suponga que quiere calcular la cantidad de 
horas semanales que trabajan los recolectores de basura. La información de ciertas 
dependencias estatales o federales que normalmente estudian la fuerza de trabajo puede 
ser útil para obtener un cálculo aproximado de la desviación estándar. 

3. Emplee un enfoque basado en el intervalo. Para aplicar este enfoque necesita conocer 
o contar con un cálculo de los valores máximo y mínimo de la población. Recuerde, del 
capítulo 3, en el que se explicó la regla empírica, que se podía esperar que casi todas las 
observaciones se encontraran a más o menos 3 desviaciones estándares de la media, si 
la distribución seguía la distribución normal. Por consiguiente, la distancia entre los valo- 
res máximo y mínimo es de 6 desviaciones estándares. Puede calcular la desviación 
estándar como un sexto del rango. Por ejemplo, la directora de operaciones del University 
Bank desea un cálculo aproximado del número de cheques que expiden cada mes los 
estudiantes universitarios. Ella cree que la distribución del número de cheques es normal. 
La cantidad mínima de cheques expedidos cada mes es de 2, y la máxima, de 50. El rango 
de la cantidad de cheques que se expiden por mes es de 48, que se determina al restar 
50 - 2. El estimador de la desviación estándar es entonces de 8 cheques mensuales: 
48/6. 

Tamaño de la muestra para calcular 
una media poblacional 

Para calcular una media poblacional, se puede expresar la interacción entre estos tres facto- 
res y el tamaño de la muestra se expresa con la fórmula siguiente. Note que esta fórmula es 
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el margen de error que se utiliza para calcular los puntos extremos de los intervalos de con- 
fianza para estimar una media poblacional. 


E = 


z 


CT 

vñ 


Al despejar n en esta ecuación se obtiene el siguiente resultado: 


TAMAÑO DE LA MUESTRA PARA ESTIMAR 
LA MEDIA DE LA POBLACIÓN 





(9-5) 


J 


donde: 

n es el tamaño de la muestra. 

z es el valor normal estándar correspondiente al nivel de confianza deseado. 
ct es la desviación estándar de la población. 

E es el error máximo admisible. 

El resultado de este cálculo no siempre es un número entero. Cuando el resultado no es 
un entero, se acostumbra redondear cualquier resultado fraccionario. Por ejemplo, 201.21 se 
redondearía a 202. 


Cjemplo 


Solución 


Un estudiante de administración pública desea determinar la cantidad media que ganan al mes 
los miembros de los consejos ciudadanos de las grandes ciudades. El error al calcular la media 
debe ser inferior a $100, con un nivel de confianza de 95%. El estudiante encontró un informe 
del Departamento del Trabajo en el que la desviación estándar es de $1 000. ¿Cuál es el tama- 
ño de la muestra que se requiere? 


El error máximo admisible, E, es de $100. El valor z de un nivel de confianza de 95% es de 
1 .96, y el estimador de la desviación estándar, $1 000. Al sustituir estos valores en la fórmula 
(9-5) se obtiene el tamaño de la muestra que se requiere: 


n = 



(1 ,96)($1 000) 
$100 


(19.6) 2 = 384.16 


El valor calculado de 384.16 se redondea a 385. Se requiere una muestra de 385 para satisfa- 
cer las especificaciones. Si el estudiante desea incrementar el nivel de confianza, por ejemplo, 
a 99%, se requerirá una muestra más grande. El valor z correspondiente al nivel de confianza 
de 99% es 2.58. 

- - m - rar*)’ - - — 

Se recomienda una muestra de 666. Observe cuánto modificó el tamaño de la muestra el cam- 
bio en el nivel de confianza. Un incremento del nivel de confianza de 95% al de 99% dio como 
resultado un incremento de 281 observaciones o 73% [(666/385)*1 00]. Esto puede incremen- 
tar mucho el costo del estudio, en términos de tiempo y dinero. De ahí que deba considerarse 
con cuidado el nivel de confianza. 


Tamaño de la muestra para calcular 
la proporción de una población 

Para determinar el tamaño de la muestra en el caso de una proporción, es necesario especi- 
ficar estas mismas tres variables: 

1 . El margen de error. 

2. El nivel de confianza deseado. 

3. La variación o dispersión de la población a estudiar. 
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En el caso de la distribución binomial, el margen de error es: 


E = z 


tt(1 — tt) 


Si se resuelve la ecuación para despejar n se obtiene lo siguiente: 


TAMAÑO DE LA MUESTRA DE LA f zV 

PROPORCIÓN DE LA POBLACIÓN n ~ 77(1 ^ \E ) 




(9-6) 




donde: 

n es el tamaño de la muestra. 

z es el valor normal estándar correspondiente al nivel de confianza deseado. 

tt es la proporción de la población. 

E es el máximo error tolerable. 

Las elecciones del estadístico z y el margen de error E son las mismas que para calcular 
la media poblacional. Sin embargo, en este caso la desviación estándar de la población de una 
distribución normal está representada por ir(1 — tt). Para encontrar el valor de una proporción 
de la población, podemos hallar un estudio similar o conducir un estudio piloto. Si no se puede 
encontrar un valor confiable, entonces se debe usar un valor de tt de 0.50. Observe que 
tt(1 — tt) tiene el mayor valor utilizando 0.50 y, por lo tanto, sin una buena estimación de la 
proporción de la población, se sobrestima el tamaño de la muestra. Esta diferencia no afecta- 
rá el estimador de la proporción de la población. 


r 

Cjemplo 

En el estudio del ejemplo anterior también se calcula la proporción de ciudades que cuentan 
con recolectores de basura privados. El estudiante desea que el margen de error se encuentre 
a 0.10 de la proporción de la población; el nivel de confianza deseado es de 90%, y no se 
encuentra disponible ningún estimador de la proporción de la población. ¿Cuál es el tamaño 
de la muestra que se requiere? 

Solución 

El estimador de la proporción de la población se encuentra a 0.1 0, por lo que £ = 0.1 0. El nivel 
de confianza deseado es de 0.90, que corresponde a un valor z de 1.65. Como no se encuen- 
tra disponible ningún estimador de la población, se utiliza 0.50. El número de observaciones 
que se sugiere es 

/ 1 .65 V 

n = (.5)(1 ,5)(^ 1Q J = 68.0625 


El investigador necesita una muestra aleatoria de 69 ciudades. 




Autoevaluación 


9-4 



El secretario académico de la universidad desea calcular el promedio aritmético de las calificacio- 
nes de los estudiantes que se graduaron durante los pasados 10 años. Los promedios oscilan entre 
2.0 y 4.0. El promedio se va a calcular a 0.05 más o menos de la media poblacional. La desviación 
estándar se calcula que es de 0.279. Utilice el nivel de confianza de 99%. ¿Ayudaría al secretarlo a 
determinar cuántas boletas tiene que estudiar? 
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connect 


OA7 Ajustar el intervalo 
de confianza de poblaciones 
finitas. 


Ejercicios 

19. Se calcula que una población tiene una desviación estándar de 10. Desea estimar la media de la 
población a menos de 2 unidades del error máximo admisible, con un nivel de confianza de 95%. 
¿De qué tamaño debe ser la muestra? 

20. Quiere estimar la media de la población a menos de 5, con un nivel de confianza de 99%. Se cal- 
cula que la desviación estándar es de 15. ¿De qué tamaño debe ser la muestra? 

21. El estimador de la proporción poblacional debe estar a más o menos 0.05, con un nivel de con- 
fianza de 95%. El mejor estimador de la proporción poblacional es de 0.15. ¿De qué tamaño debe 
ser la muestra que se requiere? 

22. El estimador de la proporción poblacional debe estar a más o menos de 0.10, con un nivel de con- 
fianza de 99%. El mejor estimador de la proporción poblacional es de 0.45. ¿De qué tamaño debe 
ser la muestra que se requiere? 

23. Se planea llevar a cabo una encuesta para determinar el tiempo medio que ven televisión los eje- 
cutivos corporativos. Una encuesta piloto indicó que el tiempo medio por semana es de 12 horas, 
con una desviación estándar de 3 horas. Se desea calcular el tiempo medio que se ve televisión 
menos de un cuarto de hora. Se utilizará el nivel de confianza de 95%. ¿A cuántos ejecutivos debe 
entrevistarse? 

24. Un procesador de zanahorias corta las hojas, lava las zanahorias y las inserta en un paquete. En 
una caja se guardan veinte paquetes para enviarse. Para controlar el peso de las cajas, se revisa- 
ron unas cuantas. El peso medio fue de 20.4 libras, y la desviación estándar, de 0.5 libras. 
¿Cuántas cajas debe tener la muestra para conseguir una confianza de 95% de que la media de 
la muestra no difiere de la media de la población por más de 0.2 libras? 

25. Suponga que el presidente de Estados Unidos desea un cálculo de la proporción de la población 
que apoya su actual política relacionada con las revisiones del sistema de seguridad social. El pre- 
sidente quiere que el cálculo se encuentre a menos de 0.04 de la proporción real. Suponga un nivel 
de confianza de 95%. Los asesores políticos del presidente calculan que la proporción que apoya 
la actual política es de 0.60. 

a) ¿De qué tamaño debe ser la muestra que se requiere? 

b) ¿De qué tamaño debe ser una muestra si no hubiera disponible ningún estimador de la pro- 
porción que apoya la actual política? 

26. Las encuestas anteriores revelan que 30% de los turistas que van a Las Vegas a jugar durante el 
fin de semana gasta más de $1 000 cada uno. La gerencia desea actualizar este porcentaje. 

a) El nuevo estudio utilizará el nivel de confianza de 90%. El estimador estará a menos de 1 % de 
la proporción de la población. ¿Cuál es el tamaño necesario de la muestra? 

b) La gerencia indicó que el tamaño de la muestra determinado es demasiado grande. ¿Qué se 
puede hacer para reducir la muestra? Con base en su sugerencia, vuelva a calcular el tamaño 
de la muestra. 


9.6 Factor de corrección 
de una población finita 

Las poblaciones de las que se han tomado muestras hasta ahora han sido muy grandes o infi- 
nitas. ¿Qué sucedería si la población de la que se toma la muestra no fuera muy grande? Es 
necesario realizar algunos ajustes en la forma de calcular el error estándar de las medias 
muéstrales y del error estándar de las proporciones muéstrales. 

Una población con un límite superior es finita. Por ejemplo, hay 12 179 estudiantes en la 
matrícula de la Eastern Illinois University; hay 40 empleados en Spence Sprockets; Chrysler 
ensambló 91 7 Jeeps Wrangler en la planta de Alexis Avenue el día de ayer; o había 65 pacien- 
tes programados para cirugía en St. Rose Memorial Hospital en Sarasota el día de ayer. Una 
población finita puede ser muy pequeña; puede constar de todos los estudiantes registrados 
para este curso. También puede ser muy grande, como todas las personas de la tercera edad 
que viven en Florida. 

En el caso de una población finita, en la que el número total de objetos o individuos es N 
y el número de objetos o individuos incluidos en la muestra es n, es necesario ajustar los erro- 
res muéstrales en las fórmulas de los intervalos de confianza. En otras palabras, para deter- 
minar el intervalo de confianza de la media, se ajusta el error estándar de la media en las 
fórmulas (9-1) y (9-2). Si quiere determinar el intervalo de confianza de una proporción, nece- 
sita ajustar el error estándar de la proporción en la fórmula (9-3). 
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Este ajuste recibe el nombre de factor de corrección de una población finita. Con fre- 
cuencia se le abrevia FCP, el cual es: 


FPC 


N - n 
N - 1 


¿Por qué es necesario aplicar un factor y cuál es el efecto de hacerlo? Por lógica, si la 
muestra es un porcentaje significativo de la población, el estimador es más preciso. Observe 
el efecto del término ( N — n)/(N — 1). Suponga que la población es de 1 000 y que la muestra 
es de 100. Entonces esta razón es de (1 000 - 100)/(1 000 - 1), o 900/999. Al extraer la raíz 
cuadrada se obtiene el factor de corrección 0.9492. Al multiplicar este factor de corrección por 
el error estándar, se reduce el error estándar aproximadamente 5% (1 — 0.9492 = 0.0508). 
Esta reducción de la magnitud del error estándar da como resultado un intervalo menor de 
valores al calcular la media poblacional o la proporción poblacional. Si la muestra es de 200, 
el factor de corrección es de 0.8949, lo cual significa que el error estándar se redujo más de 
10%. La tabla 9-2 muestra los efectos de diversos tamaños de muestras. 


TABLA 9-2 Factor de corrección de una población finita de muestras seleccionadas cuando 
la población es de 1 000. 


Tamaño de 
la muestra 

Fracción de 
la población 

Factor de 
corrección 

10 

.010 

.9955 

25 

.025 

.9879 

50 

.050 

.9752 

100 

.100 

.9492 

200 

.200 

.8949 

500 

.500 

.7075 


Así, si quisiera construir un intervalo de confianza de una media a partir de una población fini- 
ta sin conocer la desviación estándar de la población, la fórmula (9-2) se ajusta de la siguien- 
te manera: 



Haría un ajuste similar en la fórmula (9-3), en caso de una proporción. 

El siguiente ejemplo resume los pasos para determinar un intervalo de confianza de una 
media. 


Cjemplo 


Hay 250 familias en Scandia, Pennsylvania. Una muestra aleatoria de 40 de estas familias reve- 
la que la contribución anual media a la iglesia fue de $450, y la desviación estándar, de $75. 
¿La media poblacional puede ser de $445 o $425? 

1 . ¿Cuál es la media de la población? ¿Cuál es el mejor estimador de la media poblacional? 

2. Construya el intervalo de confianza de 90% de la media de la población. ¿Cuáles son los 
puntos extremos del intervalo de confianza? 

3. Interprete el intervalo de confianza. 
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Solución 


Primero observe que la población es finita. Es decir, existe un límite para el número de perso- 
nas que hay en Scandia, en este caso, 250. 

1 . No conoce la media poblacional, que es el valor que quiere calcular. El mejor estimador de 
la media poblacional es la media de la muestra, que es de $450. 

2. La fórmula para determinar el intervalo de confianza de una media de población es la 
siguiente: 



En este caso, sabe que X = 450, s = 75, N = 250 y que n = 40. No conoce la desviación 
estándar de la población, así que utiliza la distribución t. Para hallar el valor apropiado de 
t recurra al apéndice B.2, recorra la parte superior del renglón hasta la columna con el 
encabezamiento de 90%. Los grados de libertad son: gl = n - 1 = 40 - 1 = 39; así, vaya 
a la celda en la que el renglón de gl de 39 interseca la columna con el encabezamiento de 
90%. El valor es de 1 .685. Al sustituir estos valores en la fórmula, se obtiene: 



= $450 ± 1 .685 


$75 

V40 



$450 ± $1 9.98 V78434 = $450 ± $18.35 


Los puntos extremos del intervalo de confianza son $431 .65 y $468.35. 

3. Es probable que la media poblacional sea de más de $431 .65 e inferior a $468.35. En otras 
palabras, ¿la media de la población puede ser de $445? Sí, pero no es probable que sea 
de $425. ¿Por qué? Porque el valor de $445 se encuentra dentro del intervalo de confian- 
za y $425 no pertenece al intervalo de confianza. 


Autoevaluación 9-5 



El mismo estudio relacionado con las contribuciones para la iglesia en Scandia reveló que 15 de las 
40 familias tomadas de la muestra asiste regularmente a la iglesia. Construya el intervalo de con- 
fianza de 95% de la población de familias que asiste a la iglesia con regularidad. 


comect 


Ejercicios 

27. Se seleccionan al azar 36 artículos de una población de 300. La media de la muestra es de 35, y 
la desviación estándar, de 5. Construya el intervalo de confianza de 95% de la media poblacional. 

28. Se seleccionan al azar 45 elementos de una población de 500. La media muestral es de 40 y la 
desviación estándar de la muestra es de 9. Construya el intervalo de confianza de 99% de la media 
poblacional. 

29. La asistencia al juego de béisbol de la liga menor de Savannah Colts de la noche anterior fue de 
400. Una muestra aleatoria de 50 asistentes reveló que la cantidad media de refrescos consumi- 
dos por persona fue de 1 .86, con una desviación estándar de 0.50. Construya el intervalo de con- 
fianza de 99% de la cantidad media de refrescos consumidos por persona. 

30. Hay 300 soldadores en Malne Shipyards Corporation. Una muestra de 30 de ellos reveló que 18 
se graduaron en un curso de soldadura certificado. Construya el intervalo de confianza de 95% de 
la proporción de soldadores graduados en un curso de soldadura certificado. 




Ejercicios del capítulo 
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comect 


Resumen del capítulo 

I. Un estimador puntual es un solo valor (estadístico) para estimar un valor de la población (pará- 
metro). 

II. Un intervalo de confianza es un conjunto de valores entre los cuales se espera que ocurra el pará- 
metro de la población. 

A. Los factores que determinan la magnitud de un intervalo de confianza de una media son: 

1. El número de observaciones en la muestra, n. 

2. La variabilidad en la población, normalmente calculada por la desviación estándar de la 
muestra, s. 

3. El nivel de confianza. 

a) Para determinar los límites de confianza cuando se conoce la desviación estándar de la 
población se utiliza la distribución z. La fórmula es: 

X ± (9-1) 

b) Para determinar los límites de confianza cuando no se conoce la desviación estándar 
de la población se utiliza la distribución t. La fórmula es: 

X ±t ^= (9-2) 

III. Las principales características de la distribución t son: 

A. Es una distribución continua. 

B. Tiene forma de campana y es simétrica. 

C. Es plana, o más amplia, que la distribución normal estándar. 

D. Existe una familia de distribuciones t, según el número de grados de libertad. 

IV. Una proporción es una razón, fracción o porcentaje que indica la parte de la muestra o población 
que posee una característica particular. 

A. Una proporción muestral se determina por medio de X, el número de éxitos, dividido entre n, el 
número de observaciones. 

B. Se construyó un intervalo de confianza de una proporción muestral con la siguiente fórmula: 

lp( 1 - p) 

P ±Z V A7 (9 ' 4) 


V. Es posible determinar un tamaño apropiado de muestra para calcular tanto medias como propor- 
ciones. 

A. Hay tres factores que determinan el tamaño de una muestra cuando desea calcular la media. 

1. El margen de error máximo, E. 

2. El nivel de confianza deseado. 

3. La variación en la población. 

4. La fórmula para determinar el tamaño muestral de la media es: 



B. Hay tres factores que determinan el tamaño de una muestra cuando desea calcular una propor- 
ción. 

1 . El margen de error, E. 

2. El nivel de confianza deseado. 

3. Un valor de tt para calcular la variación en la población. 

4. La fórmula para determinar el tamaño muestral de una proporción es: 


n = tt(1 — tt) 



(9-6) 


VI. 


En el caso de una población finita, el error estándar se ajusta con el factor 



Ejercicios del capítulo 

31. Una muestra aleatoria de 85 líderes de grupo, supervisores y personal similar de General Motors 
reveló que, en promedio, pasan 6.5 años en su trabajo antes de ascender. La desviación estándar 
de la muestra fue de 1 .7 años. Construya el intervalo de confianza de 95 por ciento. 
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32. A un inspector de carne del estado de lowa se le encargó calcular el peso neto medio de los 
paquetes de carne molida con la etiqueta “3 libras”. Por supuesto, se da cuenta de que los paque- 
tes no pesan precisamente 3 libras. Una muestra de 36 paquetes revela que el peso medio es de 
3.01 libras, con una desviación estándar de 0.03 libras. 

a) ¿Cuál es la media poblacional estimada? 

b) Determine el intervalo de confianza de 95% de la media poblacional. 

33. Como parte de su paquete promocional, la Cámara de Comercio de Milwaukee desea tener una 
estimación del costo medio mensual de un apartamento de una recámara. Una muestra aleatoria 
de 40 apartamentos disponibles para renta reveló que el costo medio mensual era de $323. La 
desviación estándar de la muestra es $25. 

a) Determine un intervalo de confianza de 98% para el precio medio de la población. 

b) ¿Es razonable concluir que la media poblacional fue de $350 por mes? 

34. Una encuesta reciente a 50 ejecutivos despedidos reveló que tardaron 26 semanas en colocarse 
en otro puesto. La desviación estándar de la muestra fue de 6.2 semanas. Construya el intervalo 
de confianza de 95% de la media de población. ¿Es razonable que la media poblacional sea de 
28 semanas? Justifique su respuesta. 

35. Marty Rowatti recién asumió el puesto de director de la YMCA de South Jersey. Le gustaría con- 
tar con datos recientes sobre el tiempo que han pertenecido a la YMCA sus miembros actuales. 
Para investigarlo, suponga que selecciona una muestra aleatoria de 40 miembros actuales. El 
tiempo medio de membresía de quienes se encuentran en la muestra es de 8.32 años, y la des- 
viación estándar, de 3.07 años. 

a) ¿Cuál es la media de la población? 

ib) Construya un intervalo de confianza de 90% para la media poblacional. 

c) La directora anterior, en el breve informe que preparó al retirarse, indicó que ahora el tiempo 
medio de membresía era de “casi 10 años”. ¿Confirma la información esta aseveración? Cite 
evidencias. 

36. La American Restaurant Association reunió información sobre la cantidad de veces que los matri- 
monios jóvenes comen fuera de casa a la semana. Una encuesta de 60 parejas indicó que la can- 
tidad media de comidas fuera de casa es de 2.76 comidas semanales, con una desviación 
estándar de 0.75, también por semana. Construya el intervalo de confianza de 97% de la media 
poblacional. 

37. La National Collegiate Athletic Association (NCAA) informó que la cantidad media de horas sema- 
nales que los asistentes de los entrenadores de fútbol invierten en entrenamiento y reclutamiento 
durante la temporada es de 70. Una muestra aleatoria de 50 asistentes indicó que la media de la 
muestra es de 68.6 horas, con una desviación estándar de 8.2 horas. 

a) De acuerdo con los datos de la muestra, construya el intervalo de confianza de 99% de la 
media de la población. 

ib) ¿Incluye el intervalo de confianza de 99% ei valor que sugiere la NCAA? Interprete este resul- 
tado. 

c) Suponga que decidió cambiar el intervalo de confianza de 99 a 95%. Sin realizar cálculos, 
¿aumentará el intervalo, se reducirá o permanecerá igual? ¿Qué valores de la fórmula cambia- 
rán? 

38. El Departamento de Recursos Humanos de Electronics, Inc., desea incluir un plan dental como 
parte del paquete de prestaciones. La pregunta que se plantea es: ¿cuánto invierte un empleado 
común y su familia en gastos dentales al año? Una muestra de 45 empleados revela que la canti- 
dad media que se invirtió el año pasado fue de $1 820, con una desviación estándar de $660. 

a) Construya el intervalo de confianza de 95% de la media poblacional. 

ib) Al presidente de Electronics, Inc., se le proporcionó la información del inciso a). Éste indicó que 
podía pagar $1 700 de gastos dentales por empleado. ¿Es posible que la media poblacional 
pudiera ser de $1 700? Justifique su respuesta. 

39. Un estudiante llevó a cabo un estudio e informó que el intervalo de confianza de 95% de la media 
variaba de 46 a 54. Estaba seguro de que la media de la muestra era de 50; de que la desviación 
estándar de la muestra era de 16, y de que la muestra era de por lo menos 30 elementos, pero no 
recordaba el número exacto. ¿Puede usted ayudarle? 

40. Un estudio reciente llevado a cabo por la American Automobile Dealers Association reveló que la 
cantidad media de utilidades por automóvil vendido en una muestra de 20 concesionarias fue de 
$290, con una desviación estándar de $125. Construya el intervalo de confianza de 95% de la 
media poblacional. 

41. Un estudio de 25 graduados de universidades de cuatro años llevado a cabo por la American 
Banker’s Association reveló que la cantidad media que debía un estudiante por concepto de cré- 
dito estudiantil era de $14 381 . La desviación estándar de la muestra fue de $1 892. Construya el 
intervalo de confianza de 90% de la media poblacional. ¿Es razonable concluir que la media de la 
población en realidad es de $15 000? Indique por qué. 


Ejercicios del capítulo 
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42 . Un factor importante en la venta de propiedades residenciales es la cantidad de personas que le 
echan un vistazo a las casas. Una muestra de 15 casas vendidas recientemente en el área de 
Buffalo, Nueva York, reveló que el número medio de personas que ven las casas fue de 24, y la 
desviación estándar de la muestra, de 5 personas. Construya el intervalo de confianza de 98% de 
la media poblacional. 

43 . Warren County Telephone Company afirma en su informe anual que “el consumidor habitual gasta 
$60 mensuales en el servicio local y de larga distancia”. Una muestra de 12 abonados reveló las 
cantidades que gastaron el mes pasado. ^ ¡j 


$64 $66 $64 $66 $59 $62 $67 $61 $64 $58 $54 $66 


a) ¿Cuál es el estimador puntual de la media poblacional? 

£>) Construya el intervalo de confianza de 90% de la media poblacional. 

c) ¿Es razonable la afirmación de la compañía de que el “consumidor habitual” gasta $60 men- 
suales? Justifique su respuesta. 

44 . El fabricante de una nueva línea de impresoras de inyección de tinta desea incluir, como parte de 
su publicidad, el número de páginas que el usuario puede imprimir con un cartucho. Una muestra 
de 10 cartuchos reveló el siguiente número de páginas impresas. m 


2 698 

2 028 

2 474 

2 395 

2 372 

2 475 

1 927 

3 006 

2 334 

2 379 


a) ¿Cuál es el estimador puntual de la media poblacional? 

£>) Construya el intervalo de confianza de 95% de la media poblacional. 

45 . La doctora Susan Benner es psicóloga industrial. En este momento estudia el estrés en los ejecu- 
tivos de las compañías de internet. Elaboró un cuestionario que cree que mide el estrés. Un resul- 
tado de 80 indica un nivel de estrés peligroso. Una muestra aleatoria de 15 ejecutivos reveló los 
siguientes niveles de estrés. m 


94 

78 

83 

90 

78 

99 

97 

90 

97 

90 

93 

94 

100 

75 

84 


a) Determine el nivel medio de estrés de esta muestra. ¿Cuál es el estimador puntual de la media 
poblacional? 

£>) Construya el intervalo de confianza de 95% de la media poblacional. 

c) ¿Es razonable concluir que los ejecutivos de internet tienen un nivel medio de estrés peligroso, 
según el cuestionario de la doctora Benner? 

46 . Como requisito para obtener el empleo, los candidatos de Fashion Industries deben pasar por una 
prueba de drogas. De los últimos 220 solicitantes, 14 reprobaron. Construya el nivel de confianza 
de 99% de la proporción de solicitantes que no pasan la prueba. ¿Es razonable concluir que más 
de 10% de los solicitantes no la superan? 

47 . Fashion Industries aplica pruebas aleatorias a sus empleados a lo largo del año. El año pasado, de 
las 400 pruebas aleatorias aplicadas, 14 empleados no pasaron. ¿Es razonable concluir que 
menos de 5% de los empleados no pasan la prueba aleatoria de drogas? Explique su respuesta. 

48 . Durante un debate nacional sobre cambios en el sistema de salud, un servicio de noticias por 
cable realizó una encuesta de opinión entre 500 pequeños propietarios de empresas. Se reveló 
que 65% de estos pequeños empresarios no aprueban los cambios. Construya el intervalo de con- 
fianza de 95% de la proporción que se opone a dichos cambios en el sistema de salud. Comente 
los resultados. 

49 . En York County, Carolina del Sur, hay 20 000 votantes. Una muestra aleatoria de 500 votantes de 
esa localidad reveló que 350 planean votar por el regreso al senado de Louella Millar. Construya el 
intervalo de confianza de 99% de la proporción de votantes en el condado que planea votar por 
Millar. A partir de la información de esta muestra, ¿es posible confirmar su reelección? 

50 . En una encuesta para medir la popularidad del presidente, se pidió a una muestra aleatoria de 
1 000 electores que marcara una de las siguientes afirmaciones: 

1. El presidente hace un buen trabajo. 

2. El presidente realiza un trabajo deficiente. 

3. Prefiero no opinar. 
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Un total de 560 entrevistados eligió la primera afirmación e indicó que considera que el presiden- 
te realiza un buen trabajo. 

a) Construya el intervalo de confianza de 95% de la proporción de entrevistados que piensan que 
el presidente hace un buen trabajo. 

b) Con base en el intervalo del inciso a), ¿es razonable llegar a la conclusión de que la mayoría 
(más de la mitad) de la población considera que el presidente realiza un buen trabajo? 

51 . Edward Wilkin, jefe de la policía de River City, informa que hubo 500 infracciones de tránsito el mes 
pasado. Una muestra de 35 de estas infracciones mostró que la suma media de las multas fue de 
$54, con una desviación estándar de $4.50. Construya el intervalo de confianza de 95% de la 
suma media de una infracción en River City. 

52. El First National Bank de Wilson tiene 650 clientes con cuentas de cheques. Una encuesta recien- 
te de 50 de estos clientes mostró que 26 tenían una tarjeta Visa con el banco. Construya el inter- 
valo de confianza de 99% de la proporción de clientes con cuenta de cheques que tienen una 
tarjeta Visa con el banco. 

53. Se estima que 60% de los hogares en Estados Unidos contrata televisión por cable. A usted le 
gustaría verificar esta afirmación para su clase de comunicación masiva. Si desea que su estima- 
dor se encuentre a menos de 5 puntos porcentuales con un nivel de confianza de 95%, ¿qué tama- 
ño de muestra requiere? 

54. Usted necesita calcular la cantidad media de días que viajan al año los vendedores. La media de 
un pequeño estudio piloto fue de 150 días, con una desviación estándar de 14 días. Si usted debe 
calcular la media poblacional a menos de 2 días, ¿a cuántos vendedores debe incluir en la mues- 
tra? Utilice un intervalo de confianza de 90 por ciento. 

55. Usted va a llevar a cabo el sondeo de una muestra para determinar el ingreso medio familiar en un 
área rural del centro de Florida. La pregunta es: ¿a cuántas familias se debe incluir en la muestra? 
En una muestra piloto de 10 familias, la desviación estándar de la muestra fue de $500. El patro- 
cinador de la encuesta desea que usted utilice un nivel de confianza de 95%. El estimador debe 
estar dentro de un margen de $100. ¿A cuántas familias debe entrevistar? 

56. Families USA, revista mensual que trata temas relacionados con la salud y sus costos, encuesto a 
20 de sus suscriptores. Encontró que las primas anuales de seguros de salud para una familia con 
cobertura de una empresa promediaron $10 979. La desviación estándar de la muestra fue de 
$1 000 . 

a) Con base en la información de esta muestra, construya el intervalo de confianza de 90% de la 
prima anual media de la población. 

b) ¿De qué tamaño debe ser la muestra para que la media poblacional se encuentre dentro de un 
margen menor a $250, con 99% de confianza? 

57. La presurización en la cabina del avión influye en la comodidad de los pasajeros. Una presuriza- 
ción más alta permite un ambiente más cercano a lo normal y un vuelo más relajado. Un estudio 
que llevó a cabo un grupo de usuarios de aerolíneas registró la presión de aire correspondiente a 
30 vuelos elegidos de forma aleatoria. El estudio reveló una presión equivalente media de 8 000 
pies, con una desviación estándar de 300 pies. 

a) Establezca un intervalo de confianza de 99% para la presión equivalente de la media poblacional. 

b) ¿De qué tamaño necesita ser la muestra para que la media de la población se encuentre den- 
tro de un margen de 25 pies, con una confianza de 95 por ciento? 

58. Una muestra aleatoria de 25 personas empleadas por las autoridades del estado de Florida esta- 
bleció que ganaban un salario promedio (con prestaciones) de $65.00 por hora. La desviación 
estándar es de $6.25 por hora. 

a) ¿Cuál es la media de la población? ¿Cuál es el mejor estimador de la media poblacional? 
ib) Construya el intervalo de confianza de 99% del salario medio de la población (con prestacio- 
nes) de estos empleados. 

c) ¿De qué tamaño debe ser la muestra para calcular la media de la población con un error admi- 
sible de $1 .00, con una confianza de 95 por ciento? 

59. Una alianza cinematográfica utilizó una muestra aleatoria de 50 ciudadanos estadounidenses para 
calcular que el estadounidense común vio videos y películas en DVD 78 horas el año pasado. La 
desviación estándar de esta muestra fue de 9 horas. 

a) Construya el intervalo de confianza de 95% de la cantidad media poblacional de horas emplea- 
das en ver videos y películas en DVD el año pasado. 

b) ¿De qué tamaño debe ser la muestra para que resulte 90% confiable de que la media de la 
muestra se encuentra dentro de un margen de 1 .0 hora de la media de la población? 

60. Dylan Jones lleva registros meticulosos de la eficiencia en el gasto de combustible de su nuevo 
auto. Después de las primeras nueve veces que llenó el tanque, encontró que la media era de 23.4 
millas por galón (mpg) con una desviación estándar muestral de 0.9 mpg. 

a) Calcule el intervalo de confianza del 95% para su mpg. 

Jb) ¿Cuántas veces debe llenar el tanque de gasolina para obtener un margen de error por debajo 
de 0.1 mpg? 


Ejercicios de la base de datos 
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61. Una encuesta a 36 propietarios de ¡Phone seleccionados al azar mostró que el precio de compra 
tiene una media de $416, con una desviación estándar muestral de $180. 

a) Calcule el error estándar de la media muestral. 

b) Calcule el intervalo de confianza de 95% de la media. 

c) ¿De qué tamaño debe ser la muestra para estimar la media poblacional dentro de $10? 

62. Usted planea llevar a cabo una encuesta para hallar la proporción de fuerza laboral con dos o más 
trabajos. Decide con base en un nivel de confianza de 95%, y establece que la proporción estima- 
da debe encontrarse en un margen de menos de 2% de la proporción poblacional. Una encuesta 
piloto revela que 5 de 50 de los entrevistados tenían dos o más trabajos. ¿A cuántos trabajadores 
debe entrevistar para satisfacer los requisitos? 

63. La proporción de contadores públicos que cambiaron de empresa en los últimos tres años se debe 
calcular con un margen de 3%. Es necesario utilizar el nivel de confianza de 95%. Un estudio que 
se realizó hace varios años reveló que el porcentaje de contadores públicos que cambió de com- 
pañía en tres años fue de 21 . 

a) Para actualizar el estudio, ¿cuál es el número de expedientes de contadores públicos que se 
deben estudiar? 

£>) ¿Con cuántos contadores públicos es necesario ponerse en contacto si no se cuenta con esti- 
madores anteriores de la proporción poblacional? 

64. Como parte de una revisión anual de sus cuentas, un corredor selecciona una muestra aleatoria 
de 36 clientes. Ai revisar sus cuentas, calculó una media de $32 000, con una desviación estándar 
muestral de $8 200. ¿Cuál es el intervalo de confianza de 90% del valor medio de las cuentas de 
la población de clientes? 

65. El Registro Nacional de Control de peso trata de obtener secretos de éxito de gente que ha per- 
dido cuando menos 30 libras y mantuvo su peso por al menos un año. La dependencia reporta 
que de 2 700 registrados, 459 estuvieron en una dieta baja en carbohidratos (menos de 90 gramos 
al día). 

a) Construya el intervalo de confianza de 95% de esta fracción. 

b) ¿Es posible que el porcentaje de la población sea 18 por ciento? 

c) ¿Qué tan grande debe ser la muestra para estimar la proporción dentro de 0.5 por ciento? 

66. Cerca ya de las elecciones, un servicio de noticias por cable conduce una encuesta de opinión de 
1 000 probables votantes. El resultado muestra que el contendiente republicano tiene una ventaja 
de 52 a 48 por ciento. 

a) Construya el intervalo de confianza de 95% de la proporción que favorece al candidato repu- 
blicano. 

b) Calcule la probabilidad de que el candidato demócrata sea el líder real. 

c) Repita el análisis anterior basándose en una muestra de 3 000 probables votantes. 

67. Una muestra de 352 suscriptores de la revista Wired indicó que el tiempo medio invertido en el uso 
de internet es de 13.4 horas a la semana, con una desviación estándar de 6.8 horas. Determine un 
intervalo de confianza de 95% del tiempo medio que pasan los suscriptores en la red. 

68. El Tennessee Tourism Institute (TTI) planea hacer un muestreo de la información que proporcione 
una muestra de los visitantes que ingresan al estado para saber cuántos de ellos van a acampar. 
Los cálculos actuales indican que acampa 35% de los visitantes. ¿De qué tamaño debe ser la 
muestra para calcular la proporción de la población con un nivel de confianza de 95% y un error 
admisible de 2 por ciento? 

Ejercicios de lo base de datos 

69. Consulte los datos de Real State, con información sobre las casas vendidas en Goodyear, Arizona, 
el año pasado. 

a) Construya el intervalo de confianza de 95% del precio de venta medio de las casas. 

b) Construya el intervalo de confianza de 95% de la distancia media de ia casa al centro de la ciu- 
dad. 

c) Construya el intervalo de confianza de 95% de la proporción de casas con garage. 

d) Para reportar sus hallazgos, redacte un memo de negocios a Gary Loftus, presidente de la 
Cámara de Comercio de Goodyear. 

70. Consulte ios datos Baseball 2009, con información sobre los 30 equipos de la Liga Mayor de 
Béisbol de la temporada 2009. 

a) Construya el intervalo de confianza de 95% de la cantidad media de cuadrangulares por 
equipo. 

b) Construya el intervalo de confianza de 95% de la cantidad media de errores que cometió cada 
equipo. 

c) Construya el intervalo de confianza de 95% de la cantidad media de robos de base de cada 
equipo. 
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71. Consulte los datos de los autobuses del Distrito Escolar Buena. 

a) Construya el intervalo de confianza de 95% del mantenimiento medio de los autobuses, 
ib) Construya el intervalo de confianza de 95% del millaje medio de los autobuses, 
c) Redacte un memo de negocios para el oficial estatal de transporte para reportar sus resul- 
tados. 


Comandos d© software 


1. Los comandos de Minitab de las 60 columnas de 30 núme- 
ros aleatorios del ejemplo con solución de la página 304 son 
los siguientes: 

a) Seleccione Cale, Random Data y haga clic en Normal. 

b) En el cuadro de diálogo, haga clic en Generate; escriba 
30 para el número de hileras de datos; C1-C60 en Store 
¡n column(s); 50, en Mean; 5.0 en Standard deviation, 
y finalmente haga clic en OK. 



3. A continuación aparecen los comandos Minitab correspon- 
dientes a la estadística descriptiva de la página 31 1 . Intro- 
duzca los datos en la primera columna y rotúlela Amount. En 
la barra de herramientas seleccione Stat, Basic Statistics y 
Display Descriptive Statistics. En el cuadro de diálogo 
seleccione Amount como Variable y haga clic en OK. 

4. Los comandos Minitab para el intervalo de confianza de la 
cantidad que se gasta en el centro comercial de Inlet Square 
de la página 31 1 son: 

a) Introduzca las 20 cantidades gastadas en la columna 
C1 y dé a la variable el nombre de Amount. Éste se llama 
Shopping y se localiza en la carpeta para el capítulo 9. 

b) En la barra de herramientas, seleccione Stat, Basic 
Statistics y haga clic en 1-Sample t. 

c) Seleccione Samples in columns:, seleccione Amount y 
haga clic en OK. 


2. A continuación se presentan los comandos Minitab para los 

60 intervalos de confianza de la página 304. 

a) Seleccione Stat, Basic Statistics y haga clic en 1 -Sam- 
ple Z. 

b) En el cuadro de diálogo indique que las Variables son 
C1-C60 y que la Standard Duration es de 5. En segui- 
da haga clic en Options, en la esquina inferior izquierda; 
en el siguiente cuadro de diálogo indique que el Confi- 
dence level es de 95 y haga clic en OK. Haga clic en OK 
en el cuadro de diálogo principal. 






Repaso de los capítulos 8 y 9 
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5. Los comandos de Excel para el intervalo de confianza de las 
cantidades que se gastan en el centro comercial de Inlet 
Square de la página 312 son los siguientes: 

a) De la barra de menú, seleccione Data. En el extremo 
derecho, seleccione, Data Analysis y Descriptive Sta- 
tistics, y haga clic en OK. 

b) Para el Input Range escriba A1:A21, haga clic en 

Labels in first row, escriba C1 como Output Range, 
haga clic en Summary statistics y Confidence Level 
for Mean, y, en seguida, en OK. 



Capítulo 9 


Respuestas a las autoevaluaciones 



9-1 


a) Desconocido. Se trata del valor que se desea calcular, 
ib) $20 000, estimador puntual. 

„ $3 000 „ 

c) $20 000 ± 2.58 = $20 000 ± $1 224 

d) Los puntos extremos del intervalo de confianza son 
$18 776 y $21 224. Aproximadamente 99% de los 
intervalos construidos de forma similar incluirían la 
media poblacional. 


9-2 




s = 


11.6 
10 - 1 


= 1.1353 


ib) La media poblacional no se conoce. El mejor estima- 
dor es la media de la muestra, 1 .8 días. 

c) 1.80 ± 2.262 1 ' 1 ^. 3 = 1.80 ± 0.81 
VIO 


9-3 a) p = 


420 


= .30 


1 400 

b) 30 ± 2.58(.0122) = .30 ± .03 

c) El intervalo se encuentra entre 0.27 y 0.33. Alrededor 
de 99% de los intervalos construidos de forma similar 
incluirían la media poblacional. 


9-4 


n = 


2.58(.279) 

4)5 


= 207.26. La muestra debe redon- 


dearse a 208. 


9-5 .375 ±1.96 


.375(1 - .375) / 250 - 40 


40 


250 - 1 


.375 ± 1 .96(.0765)(.91 84) = .375 ± .138 


Los puntos extremos son 0.99 y 2.61 . 

d) Se utiliza t porque no se conoce la desviación están- 
dar. 

e) El valor de 0 no se encuentra en el intervalo. No es 
razonable concluir que la cantidad media de días de 
ausencias laborales sea de 0 por empleado. 


Repaso de los capítulos 8 y 9 

El capítulo 8 comenzó con la descripción de las razones por las que es necesario el muestreo. Se hacen 
muéstreos porque con frecuencia es imposible estudiar cada elemento o individuo que integran algu- 
nas poblaciones. Resultaría muy costoso y consumiría demasiado tiempo, por ejemplo, ponerse en 
contacto con todos los ejecutivos de bancos de Estados Unidos y registrar sus ingresos anuales. 
Asimismo, el muestreo con frecuencia destruye el producto. Un fabricante de medicamentos no puede 
probar las propiedades de cada tableta elaborada, pues no le quedaría nada para vender. Por consi- 
guiente, para calcular un parámetro poblacional, se selecciona una muestra de la población. Una mues- 
tra forma parte de la población. Debe tenerse cuidado en garantizar que cada miembro de la población 
tenga la misma oportunidad de que se le elija; de otra manera, las conclusiones pueden estar sesga- 
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das. Es posible aplicar diversos métodos de muestreo, como el muestreo aleatorio simple, sistemático, 
estratificado y por conglomerados. 

Sin que importe el método de muestreo elegido, pocas veces un estadístico de la muestra es igual 
al parámetro poblacional correspondiente. Por ejemplo, la media de una muestra casi nunca es exac- 
tamente la misma que la media de la población. La diferencia entre este estadístico muestral y el pará- 
metro poblacional es el error de muestreo. 

En el capítulo 8 se demostró que, al seleccionar todas las muestras posibles de determinado tama- 
ño de una población y calcular la media de estas muestras, el resultado será exactamente igual a la 
media poblacional; también, que la dispersión en la distribución de las medias muéstrales es igual a la 
desviación estándar de la población dividida entre la raíz cuadrada del tamaño de la muestra. Este 
resultado recibe el nombre de error estándar de la media. Existe menos dispersión en la distribución de 
las medias muéstrales que en las poblacionales. Además, conforme se incrementa el número de obser- 
vaciones en cada muestra, se reduce la dispersión en la distribución del muestreo. 

El teorema central del límite es el fundamento de la inferencia estadística. Establece que si la 
población de la que se seleccionan las muestras sigue la distribución de probabilidad normal, la distri- 
bución de las medias muéstrales también seguirá la distribución normal. Si la población no es nor- 
mal, se aproximará a la distribución de probabilidad normal conforme se incremente el tamaño de la 
muestra. 

En el capítulo 9 se explican los estimadores puntuales y los estimadores por intervalo. Un estima- 
dor puntual es un solo valor que se utiliza para calcular un parámetro de la población. Un estimador por 
intervalo es un conjunto de valores en el que se espera que se presente el parámetro de la población. 
Por ejemplo, con base en una muestra, se calcula que el ingreso anual medio de los pintores profesio- 
nales de casas de Atlanta, Georgia (la población), es de $45 300. Dicho estimador recibe el nombre de 
estimador puntual. Si establece que la media de la población probablemente se encuentre en el inter- 
valo de $45 200 a $45 400, dicho estimador se denomina estimador por intervalo. Los dos puntos extre- 
mos ($45 200 y $ $45 400) son los límites de confianza de la media poblacional. Se describió el 
procedimiento para establecer un intervalo de confianza para medias grandes y pequeñas, así como 
para proporciones muéstrales. En este capítulo también se expuso un método para determinar el tama- 
ño necesario de una muestra con base en la dispersión en la población, el nivel de confianza deseado 
y la precisión deseada del estimador o margen de error. 


Glosario 


Distribución muestral de medias de la muestra Distribución 
de probabilidad que consta de todas las posibles medias de 
muestras de tamaño determinado seleccionadas de la población. 
Error de muestreo Diferencia entre un estadístico muestral y el 
correspondiente parámetro poblacional. Por ejemplo: el ingreso 
medio muestral es de $22 100; la media poblacional es de 
$22 000. El error de muestreo es: $22 100 - $ 22 000 = $100. 
Este error es atribuible al muestreo, es decir, al azar. 

Estimador de intervalo Intervalo donde probablemente se 
localiza un parámetro de población, basado en información de la 
muestra. Ejemplo: de acuerdo con los datos de la muestra, la 
media de la población está en el intervalo entre 1 .9 y 2.0 libras. 
Estimador puntual Valor único calculado a partir de una mues- 
tra para calcular un parámetro poblacional. Por ejemplo: si la 
media de la muestra es de 1 020 psi, éste constituye el mejor 
estimador de la fuerza de tensión media de la población. 

Factor de corrección de una población finita (FCP) Cuando 
se lleva a cabo un muestreo sin reemplazo a partir de una pobla- 
ción finita, se utiliza un término de corrección para reducir el error 
estándar de la media, de acuerdo con el tamaño relativo de la 
muestra respecto del tamaño de la población. El factor de 
corrección se aplica cuando la muestra constituye más de 5% de 
una población finita. 

Muestra probabilística Muestra de elementos o individuos 
elegidos de manera que cada miembro de la población cuente 
con la misma posibilidad de que se le incluya en la muestra. 
Muestreo aleatorio estratificado Una población primero se 
divide en subgrupos denominados estratos. Luego se elige una 
muestra de cada estrato. Si, por ejemplo, la población de interés 


consta de todos los estudiantes universitarios, el diseño de la 
muestra puede indicar que formen parte de la muestra 62 estu- 
diantes de primer año, 51 de segundo, 40 de tercero y 39 del últi- 
mo grado. 

Muestreo aleatorio simple Esquema de muestreo en el que 
cada miembro de la población posee la misma posibilidad de 
que se le seleccione como parte de la muestra. 

Muestreo aleatorio sistemático Si la población se ordena de 
cierta forma, ya sea alfabética, por estatura o en un archivero, se 
selecciona un punto de partida aleatorio; después, cada /r-ésimo 
elemento se convierte en miembro de la muestra. Si el diseño de 
una muestra requiere que se entreviste a cada novena familia en 
Main Street comenzando con el 932 de la calle Main, la muestra 
constaría de familias de los números 932, 941, 950 de Main, 
etcétera. 

Muestreo por conglomerados Método común para reducir el 
costo del muestreo si la población se encuentra dispersa en un 
área geográfica amplia. El área se divide en pequeñas unidades 
(condados, distritos, manzanas, etc.), denominadas unidades 
primarias. Después se eligen unas cuantas unidades primarias y 
se selecciona una muestra aleatoria de cada una. 

Sesgo Posible consecuencia de negar a determinados miem- 
bros de la población la oportunidad de ser seleccionados para la 
muestra. Como resultado, la muestra puede no ser representati- 
va de la población. 

Teorema central del límite Si el tamaño de la muestra es lo 
bastante grande, la distribución muestral de medias se aproxi- 
mará a la distribución normal con prescindencia de la forma de la 
población. 


Problemas 
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Problemas 


1. Un estudio reciente indicó que las mujeres tomaron un promedio de 8.6 semanas sin goce de suel- 
do después del nacimiento de su hijo. Suponga que esta distribución sigue la distribución normal 
de probabilidad, con una desviación estándar de 2.0 semanas. Considere una muestra de 35 muje- 
res, quienes recién regresaron a trabajar después del nacimiento de su hijo. ¿Cuál es la probabili- 
dad de que la media de esta muestra sea de por lo menos 8.8 semanas? 

2 . El gerente de Tee Short Emporium informa que la cantidad media de camisas vendidas a la sema- 
na es de 1 210, con una desviación estándar de 325. La distribución de las ventas se rige por la 
distribución normal. ¿Cuál es la probabilidad de seleccionar una muestra de 25 semanas y encon- 
trar que la media de la muestra es de 1 100 o menos? 

3 . El dueño de Guif Stream Café pretende calcular el número medio de clientes que almuerzan dia- 
riamente. Una muestra de 40 reveló una media de 160 al día, con una desviación estándar de 20 
al día. Construya el intervalo de confianza de 98% del número medio de clientes diarios. 

4 . El gerente de la sucursal local de Hamburger Express desea calcular el tiempo medio que los clien- 
tes esperan en la ventanilla de servicio para el automóvil. Una muestra de 20 clientes esperó un 
tiempo medio de 2.65 minutos, con una desviación estándar de 0.45 minutos. Construya el inter- 
valo de confianza de 90% del tiempo medio de espera. 

5 . El gerente de una compañía grande estudia el uso que se da a sus copiadoras. Una muestra alea- 
toria de seis copiadoras reveló la siguiente cantidad de copias (en miles) que se sacaron el día de 
ayer. 


826 931 1 126 918 1 011 1 101 


Construya el intervalo de confianza de 95% de la cantidad media de copias por máquina. 

6. John Kleman es anfitrión del programa de noticias KXYZ Radio 55 AM de Chicago. Durante el pro- 
grama matutino, John pide a los radioescuchas que se comuniquen y comenten sobre las noticias 
nacionales y locales. Esta mañana, John se quiso enterar de la cantidad de horas diarias que ven 
televisión los niños menores de 12 años. Las últimas cinco personas que se comunicaron informa- 
ron que, la noche anterior, sus hijos vieron la televisión la siguiente cantidad de horas: 


3.0 3.5 4.0 4.5 3.0 


¿Es razonable construir un intervalo de confianza a partir de estos datos para indicar la cantidad 
media de horas diarias que vieron televisión? Si la respuesta es afirmativa, ¿por qué no sería apro- 
piado un intervalo de confianza? 

7 . Desde siempre, Widgets Manufacturing, Inc., produce 250 partes al día. Hace poco, el nuevo pro- 
pietario compró una máquina para fabricar más partes por día. Una muestra de la producción de 
16 días reveló una media de 240 unidades, con una desviación estándar de 35. Construya el inter- 
valo de confianza de la cantidad media de partes producidas ai día. ¿Parece razonable concluir 
que se incrementó la producción media diaria? Justifique sus conclusiones. 

8. Un fabricante de baterías para teléfono celular desea calcular la vida útil de su batería (en miles de 
horas). El estimador debe estar dentro de las 0.10 (100) horas. Asuma un nivel de confianza 
de 95% y que la desviación estándar de la vida útil de la batería es 0.90 (900) horas. Determine el 
tamaño de la muestra que se requiere. 

9 . El gerente de una tienda de artículos para hacer mejoras domésticas desea calcular la cantidad 
media de dinero que se gasta en la tienda. El estimador debe tener un valor con un margen infe- 
rior a $4.00, con un nivel de confianza de 95%. El gerente no conoce el valor de la desviación 
estándar de las cantidades que se han gastado. No obstante, si calcula que el rango va de $5.00 
a $155.00, ¿de qué tamaño debe ser la muestra que necesita? 

10 . En una muestra de 200 residentes de Georgetown County, 120 informaron que creen que el 
impuesto predial en el condado es muy alto. Construya el intervalo de confianza de 95% de la pro- 
porción de residentes que creen que el impuesto es muy elevado. ¿Es razonable concluir que la 
mayoría de los contribuyentes considera que el impuesto predial es muy alto? 

11. En los últimos tiempos, el porcentaje de consumidores que adquieren un vehículo nuevo por inter- 
net ha sido tan alto que a los distribuidores locales les preocupa el efecto de esta situación en su 
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negocio. La información que se requiere constituye un estimador de la proporción de compras por 
internet. ¿De qué tamaño debe ser la muestra de compradores para que el estimador se encuen- 
tre a 2 puntos porcentuales, con un nivel de confianza de 98%? Ahora se considera que 8% de 
los vehículos se compra por internet. 

12. Desde siempre, la proporción de adultos mayores de 24 años que fuman ha sido de 0.30. Hace 
poco se publicó y transmitió por radio y televisión mucha información de que el tabaquismo no 
beneficia a la salud. Una muestra de 500 adultos reveló que sólo 25% de los entrevistados fuma- 
ba. Construya el intervalo de confianza de 98% de la proporción de adultos que fuma actualmen- 
te. ¿Estaría de acuerdo en que la proporción es inferior a 30%? 

13. El auditor del estado de Ohio necesita un estimador de la proporción de residentes que juegan 
regularmente a la lotería estatal. De acuerdo con registros anteriores, alrededor de 40% juega con 
regularidad, pero el auditor quiere información actualizada. ¿De qué tamaño debe ser la muestra 
para que el estimador se encuentre a 3 puntos porcentuales, con un nivel de confianza de 98 por 
ciento? 


Caso 


Century National Bank 

Repase la descripción del Century National Bank, localizada al 
final del repaso de los capítulos 1 a 4, de la página 141. Cuando 
Selig asumió el cargo como presidente de Century hace algunos 
años, apenas comenzaba el uso de las tarjetas de débito. A Selig 


le gustaría actualizarse en el uso de estas tarjetas. Construya el 
intervalo de confianza de 95% de la proporción de clientes que 
las utiliza. ¿Es razonable concluir que más de la mitad de los 
clientes utiliza tarjeta de débito con base en el intervalo de con- 
fianza? Redacte un breve reporte interpretando los resultados. 


Test de práctica 

Parte 1: Objetivo 

1. Si cada elemento de la población tiene la misma oportunidad de ser seleccionado, estamos ante un 

1 

2. La diferencia entre la media poblacional y la media muestral recibe el nombre de 2. 

3. El es la desviación estándar de la distribución de la media muestral. 3. 

4. Si aumenta el tamaño de la muestra, la varianza de la media muestral (se reducirá, aumentará, no cambiará). 

4 

5. Un solo valor utilizado para calcular el parámetro de una población recibe el nombre de 5. 

6. Un rango de valores dentro del cual se espera que se ubique el parámetro de la población recibe el nombre de 

6 

7. ¿Cuál de los siguientes factores no afecta la amplitud de un intervalo de confianza? (tamaño de la muestra, variación en la pobla- 
ción, nivel de confianza, tamaño de la población.) 7. 

8. La fracción de una población que tiene una característica particular recibe el nombre de 8. 

9. ¿Cuál de los siguientes elementos no es una característica de la distribución f? (con sesgo positivo, continua, media de cero, 

basada en grados de libertad). 9. 

10. ¿Qué valor se utiliza para determinar el tamaño de muestra requerido de una proporción cuando no se dispone de un estimador 
de la proporción de la población? 10 

Parte 2: Problemas 

1. Los estadounidenses pasan un promedio (media) de 12.2 minutos (al día) en la ducha. La distribución de tiempos sigue la dis- 
tribución normal, con una desviación estándar de la población de 2.3 minutos. ¿Cuál es la posibilidad de que el tiempo medio 
por día de una muestra de 12 estadounidenses sea de 11 minutos o menos? 

2. Un estudio reciente de 26 residentes de Conway, SC, reveló que habían vivido en su domicilio actual un promedio de 9.3 años. 
La desviación estándar de la muestra es de 2 años. 

a) ¿Cuál es la media poblacional? 

b) ¿Cuál es el mejor estimador de la media poblacional? 

c) ¿Cuál es el error estándar del estimador? 

d) Desarrolle un intervalo de confianza de 90% de la media poblacional. 

3. Un reciente reporte federal indicó que 27% de los niños entre los 2 y 5 años comen verduras cuando menos 5 veces a la sema- 
na. ¿Qué tan grande debe ser una muestra para calcular la proporción real de la población dentro de 2% con un nivel de con- 
fianza de 98%? Asegúrese de usar la información contenida en el reporte federal. 

4. Las autoridades de tránsito del área de Filadelfia desean calcular la proporción de trabajadores que laboran en el centro de la 
ciudad que utilizan transporte público para llegar a sus trabajos. Una muestra de 100 empleados reveló que 64 usan el trans- 
porte público. Construya el intervalo de confianza de 95% de la proporción de la población. 



1 

Pruebas de hipótesis 
de una muestra 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Definir una hipótesis. 



OA2 Describir el 
procedimiento de prueba de 
cinco pasos de una hipótesis. 

OA3 Definir los errores tipo I 
y tipo II 

OA4 Definir el término 
prueba estadística y explicar la 
forma de utilizarla. 

OA5 Distinguir entre las 
pruebas de hipótesis de una y 
dos colas. 

OA6 Llevar a cabo una 
prueba de hipótesis de una 
media poblacional. 

OA7 Calcular e interpretar el 
valor p. 

OA8 Llevar a cabo una 
prueba de hipótesis de una 
proporción poblacional. 


Dole Pineapple, Inc., está preocupada porque supone que las latas de 
16 onzas de piña rebanada contienen un exceso de producto. Suponga 
que la desviación estándar del proceso es de 0.03 onzas. El 
departamento de control de calidad tomó una muestra aleatoria de 50 
latas y comprobó que la media aritmética del peso era de 16.05 
onzas. ¿Puede concluir que el peso medio es mayor que 1 6 onzas con 
un nivel de significancia de 5%? Determine el valor p. (Vea el ejercicio 
32, objetivo 6.) 


OA9 Calcular la probabilidad 
de un error tipo II. 
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10.1 Introducción 

En el capítulo 8 dio inicio el estudio de la inferencia estadística. Se describió la forma de selec- 
cionar una muestra aleatoria y, a partir de ella, calcular el valor de un parámetro poblacional. 
Por ejemplo, se seleccionó una muestra de 5 empleados de Spence Sprockets para determi- 
nar la cantidad de años de servicio de cada empleado entrevistado, se calculó la media de los 
años de servicio y se utilizó la media de la muestra para estimar la media de los años de servi- 
cio de todo el personal. En otras palabras, se estimó un parámetro poblacional a partir de un 
estadístico de la muestra. 

En el capítulo 9 se prosiguió con el estudio de la inferencia estadística mediante la cons- 
trucción de un intervalo de confianza. Un intervalo de confianza es un conjunto de valores en 
el que se encuentra el parámetro de la población. En este capítulo, en lugar de crear un con- 
junto de valores en el que se espera que se presente el parámetro poblacional, se expone un 
procedimiento para probar la validez de un enunciado relativo a un parámetro poblacional. 
Algunos ejemplos de enunciados por probar son los siguientes: 

• La velocidad media de los automóviles que pasan por la 
señal de 150 millas de la carretera West Virginia Turnplke es 
de 68 millas por hora. 

• La cantidad media de millas que recorre una Chevy Trail- 
Blazer rentada durante tres años es de 32 000 millas. 

• El tiempo medio que una familia estadounidense vive en una 
vivienda en particular es de 11.8 años. 

• En 201 0, el salarlo inicial medio en ventas de un graduado de 
universidad fue de $47 673. 

• Treinta y cinco por ciento de los jubilados de la reglón norte 
de Estados Unidos vende su hogar y se muda a un clima 
más cálido después de un año de haberse retirado. 

• Ochenta por ciento de los jugadores asiduos a la lotería esta- 
dounidense jamás gana más de $1 00 en un juego. 

Este capítulo y algunos de los siguientes se relacionan con pruebas de hipótesis esta- 
dísticas. Primero hay que definir los términos de hipótesis estadística y pruebas de hipótesis 
estadísticas. Después se muestran los pasos para llevar a cabo una prueba de hipótesis esta- 
dística. A continuación se aplican pruebas de hipótesis para medias y proporciones. En la últi- 
ma sección del capítulo se describen los posibles errores que se deben al muestreo en las 
pruebas de hipótesis. 



10.2 / Qué es una hipótesis? 

Una hipótesis es una declaración relativa a una población. A continuación se utilizan los datos 
Una hipótesis es un enuncia- para verificar lo razonable del enunciado. Para comenzar, es necesario definir la palabra hipó- 

do acerca de un parámetro tesis. En el sistema legal estadounidense, una persona es ¡nocente hasta que se prueba su 

poblacional. culpabilidad. Un jurado plantea como hipótesis que una persona a la que se le imputa un cri- 

men es inocente, y someten esta hipótesis a verificación, para lo cual revisan la evidencia y 
escuchan el testimonio antes de llegar a un veredicto. De forma similar, un paciente visita al 
médico y acusa varios síntomas. Con base en ellos, el médico Indicará ciertos exámenes de 
diagnóstico; en seguida, de acuerdo con los síntomas y los resultados de los exámenes, deter- 
mina el tratamiento. 

En el análisis estadístico se establece una afirmación, una hipótesis, se recogen datos que 
posteriormente se utilizan para probar la aserción. Entonces, una hipótesis estadística es: 


OA1 Definir una hipótesis. 


(hipó 


J 


HIPÓTESIS Afirmación relativa a un parámetro de la población sujeta a verificación. 




10.4 Procedimiento de cinco pasos para probar una hipótesis 
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Estadística en acción 

LASIK es un procedi- 
miento quirúrgico de 15 
minutos de duración con 
un rayo láser para modifi- 
car la forma de la córnea 
con el fin de mejorar la 
visión. Las investigacio- 
nes demuestran que alre- 
dedor de 5% de las 
cirugías presenta com- 
plicaciones, como des- 
lumbramientos, visión 
borrosa, corrección exce- 
siva o insuficiente de la 
visión, y su pérdida. 
Desde una perspectiva 
estadística, las investiga- 
ciones someten a prueba 
una hipótesis nula acerca 
de que la cirugía no 
mejorará la visión frente 
a la hipótesis alternativa 
de que la cirugía la mejo- 
rará. Los datos de la 
muestra de la cirugía 
LASIK indican que 5% 
de los casos presenta 
complicaciones. Este tér- 
mino de 5% representa 
un índice de error tipo I. 
Cuando una persona 
decide someterse a la 
cirugía, espera rechazar 
la hipótesis nula. En 5% 
de los casos futuros, esta 
expectativa no se cumpli- 
rá. (Fuente: American 
Academy of Ophtlial- 
mology Journal, San 
Francisco, vol. 16, 
núm. 43.) 



En la mayoría de los casos, la población es tan grande que no es viable estudiarla por com- 
pleto. Por ejemplo, no sería posible contactar a todos los analistas de sistemas de Estados 
Unidos para preguntarles su ingreso mensual. Del mismo modo, la calidad del departamento 
de control de calidad de Cooper Tire no puede verificar todos los neumáticos que la empresa 
produce para ver si duran más de 60 000 millas. 

Como se observó en el capítulo 8, una opción para medir o entrevistar a toda la población 
es tomar una muestra de ella. Por lo tanto, así se pone a prueba una declaración para deter- 
minar si la muestra apoya o no la declaración en lo concerniente a la población. 


10.3 / Qué es la prueba de hipótesis? 

Los términos prueba de hipótesis y probar una hipótesis se utilizan indistintamente. La prueba 
de hipótesis comienza con una afirmación, o suposición, sobre un parámetro de la población, 
como la media poblacional. Como ya se indicó, esta afirmación recibe el nombre de hipótesis. 
Una hipótesis puede ser que la comisión mensual media de las comisiones de los vendedores 
de tiendas al menudeo de aparatos electrónicos, como Circuit City, es de $2 000. No es posi- 
ble entrar en contacto con todos los vendedores para asegurarnos de que la media en reali- 
dad sea de $2 000. El costo de localizar a y entrevistarse con todos los vendedores de 
aparatos electrónicos en Estados Unidos sería exorbitante. Para probar la validez de la afirma- 
ción (|x = $2 000) se debe seleccionar una muestra de la población de vendedores de apara- 
tos electrónicos, calcular el estadístico muestral y, con base en ciertas reglas de decisión, 
aceptar o rechazar la hipótesis. Una media muestral de $1 000 de los vendedores de apara- 
tos electrónicos provocaría con certeza el rechazo de la hipótesis. Sin embargo, suponga 
que la media de la muestra es de $1 995. ¿Está lo bastante cerca de $2 000 para aceptar la 
suposición de que la media de la población es de $2 000? ¿La diferencia de $5 entre las dos 
medias se puede atribuir al error de muestreo, o dicha diferencia resulta estadísticamente sig- 
nificativa? 


PRUEBA DE HIPÓTESIS Procedimiento basado en evidencia de la muestra y la teoría de la pro- 
babilidad para determinar si la hipótesis es una afirmación razonable. 


10.4 Procedimiento de cinco 

pasos para probar una hipótesis 

Existe un procedimiento de cinco pasos que sistematiza la prueba de una hipótesis; al llegar 
al paso 5, se está en posibilidades de rechazar o no la hipótesis. Sin embargo, la prueba de 
hipótesis, como la emplean los especialistas en estadística, no prueba que algo es verdadero 
de la forma en que un matemático demuestra un enunciado. Más bien, proporciona un tipo de 
prueba más allá de toda duda razonable, como en el sistema judicial. De ahí que existan reglas 
específicas de evidencia, o procedimientos. En el siguiente diagrama aparecen los pasos. 
Analizaremos con detalle cada uno de ellos. 



No se 
rechaza H 0 
o se 

rechaza H 0 
y se 

acepta H , 
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CAPÍTULO 10 Pruebas de hipótesis de una muestra 


Paso 1: Se establece la hipótesis nula [H 0 ) 
y la hipótesis alternativa (H : ) 


OA2 Describir el 
procedimiento de prueba de 
una hipótesis en cinco pasos. 


Se establecen la hipótesis 
nula y la hipótesis alternativa. 


El primer paso consiste en establecer la hipótesis que se debe probar. Ésta recibe el nombre 
de hipótesis nula, la cual se designa H 0 , y se lee “H subíndice cero”. La letra mayúscula H 
representa la hipótesis, y el subíndice cero implica que “no hay diferencia”. Por lo general se 
incluye un término no en la hipótesis nula, que significa que “no hay cambio”. Por ejemplo, la 
hipótesis nula que se refiere a la cantidad media de millas que recorre cada neumático con cin- 
turón de acero no es diferente de 60 000. La hipótesis nula se escribiría H 0 : pe = 60 000. En 
términos generales, la hipótesis nula se formula para realizar una prueba. O se rechaza o no 
se rechaza. Es una afirmación que no se rechaza a menos que la información de la muestra 
ofrezca evidencia convincente de que es falsa. 

Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de 
la muestra, no es posible decir que la hipótesis nula sea verdadera. En otras palabras, el hecho 
de no rechazar una hipótesis no prueba que H 0 sea verdadera, sino que no rechazamos H 0 . 
Para probar sin lugar a dudas que la hipótesis nula es verdadera, sería necesario conocer el 
parámetro poblacional. Para determinarlo, habría que probar, entrevistar o contar cada ele- 
mento de la población. Esto no resulta factible. La alternativa consiste en tomar una muestra 
de la población. 

También debe destacarse que con frecuencia la hipótesis nula inicia con las expresiones: 
“No existe diferencia significativa entre...” o “La resistencia media del vidrio a los impactos no 
es significativamente diferente de...” Al seleccionar una muestra de una población, el estadís- 
tico de la muestra es numéricamente distinto del parámetro poblacional hipotético. Como 
ejemplo, suponga que la hipótesis de la resistencia de un platón de vidrio a los impactos es 
de 70 psi, y que la resistencia media de una muestra de 12 platones de vidrio es de 69.5 psi. 
Se debe tomar la decisión con la diferencia de 0.5 psi. ¿Se trata de una diferencia real, es decir, 
una diferencia significativa, o la diferencia entre el estadístico de la muestra (69.5) y el pará- 
metro poblacional hipotético (70.0) es aleatorio y se debe al error de muestreo? Según se dijo, 
la respuesta a esta pregunta implica una prueba de significancia, que recibe el nombre de 
prueba de hipótesis. Una hipótesis nula es: 


HIPÓTESIS NULA Enunciado relativo al valor de un parámetro poblacional que se formula con 
el fin de probar evidencia numérica. 


La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Se 
representa H- 1 y se lee “/-/ subíndice uno”. También se le conoce como hipótesis de investiga- 
ción. La hipótesis alternativa se acepta si la información de la muestra ofrece suficiente evi- 
dencia estadística para rechazar la hipótesis nula. 


HIPÓTESIS ALTERNATIVA Enunciado que se acepta si los datos de la muestra ofrecen suficiente 
evidencia para rechazar la hipótesis nula. 


El siguiente ejemplo aclara los términos hipótesis nula y alternativa. Un artículo reciente 
indicó que el tiempo de uso medio de los aviones comerciales estadounidenses es de 1 5 años. 
Para llevar a cabo una prueba estadística relacionada con esta afirmación, el primer paso con- 
siste en determinar las hipótesis nula y alternativa. La hipótesis nula representa el estado 
actual o reportado. Se escribe: H 0 : (jl = 15. La hipótesis alternativa se refiere al hecho de que 
la afirmación no es verdadera, es decir, ^ A 15. Es necesario recordar que, sin que impor- 
te la manera de plantear el problema, la hipótesis nula siempre incluirá el signo de igual. Este 
signo (=) nunca aparecerá en la hipótesis alternativa. ¿Por qué? Porque es la afirmación que 
se va a probar, y es necesario un valor específico para incluir en los cálculos. Se recurre a la 
hipótesis alternativa sólo si la información sugiere que la hipótesis nula es falsa. 


10.4 Procedimiento de cinco pasos para probar una hipótesis 
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Paso 2: Se selecciona un nivel de significancia 

Después de establecer las hipótesis nula y alternativa, el siguiente paso consiste en determi- 
nar el nivel de significancia. 


0 


NIVEL DE SIGNFICANCIA Probabilidad de rechazar la hipótesis nula cuando es verdadera. 


J 


El nivel de significancia se expresa con la letra griega alfa, a. En ocasiones también se 
Se selecciona un nivel de sig- conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se trata del 
nificancia o riesgo. riesgo que se corre al rechazar la hipótesis nula cuando es verdadera. 

No existe ningún nivel de significancia que se aplique a todas las pruebas. Se toma la 
decisión de utilizar el nivel de 0.05 (expresado con frecuencia como nivel de 5%), nivel de 0.01 , 
nivel de 0.1 0 o cualquier otro nivel entre 0 y 1 . Se acostumbra elegir el nivel de 0.05 en el caso 
de los proyectos de investigación relacionados con los consumidores; el nivel de 0.01 en rela- 
ción con el del control de calidad, y el de 0.10 en el de las encuestas políticas. Usted, como 
investigador, debe elegir el nivel de significancia antes de formular una regla de decisión y 
recopilar los datos de la muestra. 

Para ¡lustrar cómo es posible rechazar una hipótesis verdadera, suponga que una empre- 
sa fabricante de computadoras personales utiliza una gran cantidad de tarjetas con circuitos 
Impresos. Los proveedores participan en una licitación y el que presenta la 
cotización más baja obtiene el contrato. Suponga que éste especifica que el 
departamento de control de calidad del fabricante de computadoras tomará 
una muestra de los envíos que llegan. SI más de 6% de las tarjetas de la 
muestra no cumple con las normas, el envío se rechaza. La hipótesis nula con- 
siste en que el envío de tarjetas contiene 6% o menos tarjetas que no satisfa- 
cen las normas. La hipótesis alternativa consiste en que más de 6% de las 
tarjetas están defectuosas. 

Una muestra de 50 tarjetas de circuitos de Allled Electronics, que se reci- 
bieron el 21 de julio, reveló que 4, es decir, 8%, no cumplían con las normas. 
El envío se rechazó en virtud de que excedía el máximo de 6% de tarjetas que 
no cumplían con las normas. Si en realidad el envío no cumplía con las nor- 
mas, fue acertada la decisión de devolver las tarjetas al proveedor. No obstante, suponga que 
las 4 tarjetas elegidas de la muestra de 50 eran las únicas que no cumplían con las normas en 
un envío de 4 000 tarjetas. Entonces, sólo 0.1 % se encontraba defectuoso (4/4 000 = 0.001). 
En este caso, menos de 6% de todo el envío no satisfacía las normas, y rechazarlo fue un 
error. En términos de la prueba de hipótesis, rechazamos la hipótesis nula de que el envío 
cumplía con las normas cuando se debió aceptar. Al rechazar la hipótesis nula, se incurrió en 
un error tipo I. La probabilidad de cometer este tipo de error es a. 





ERROR TIPO I 


Rechazar la hipótesis nula, H 0 , cuando es verdadera. 




La probabilidad de cometer otro tipo de error, conocido como error tipo II, se expresa con 
la letra griega beta ((3). 


d 


J 


ERROR TIPO II Aceptar la hipótesis nula cuando es falsa. 


La empresa que fabrica computadoras personales cometería un error del tipo II si, sin que 
lo sepa el fabricante, un envío de tarjetas de Allled Electronics contiene 1 5% de tarjetas que no 
cumplen con las normas, y aún así lo aceptara. ¿Cómo puede suceder esto? Suponga que 
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OA3 Definir los errores tipo 
I y tipo II. 


OA4 Definir el término 
prueba estadística y explicar 
la forma de utilizarlo. 


La regla de decisión establece 
las condiciones cuando se 
rechaza H 0 . 


2 de las 50 tarjetas (4%) no son aceptables, mientras que 48 de 50 lo son. De acuerdo con 
el procedimiento mencionado, como la muestra contiene menos de 6% de tarjetas que no 
cumplen con las normas, el envío se acepta. ¡Puede suceder que, por azar, las 48 tarjetas que 
contiene la muestra sean las únicas aceptables en todo el envío, que consta de miles de tar- 
jetas! 

En retrospectiva, el investigador no puede estudiar cada elemento o individuo de la pobla- 
ción. Por lo tanto, existe la posibilidad de que se presenten dos clases de error: un error tipo 
I, en el que se rechaza la hipótesis nula cuando en realidad debe aceptarse, y un error tipo II, 
en el que se acepta la hipótesis nula cuando en realidad debe rechazarse. 

Con frecuencia se hace referencia a la probabilidad de cometer estos dos posibles erro- 
res como alfa, a, y beta, p. Alfa (a) es la probabilidad de cometer un error tipo I, y beta (p), la 
probabilidad de cometer un error tipo II. 

La siguiente tabla resume las decisiones que el investigador puede tomar y sus posibles 
consecuencias. 


Investigador 

Hipótesis No rechaza Rechaza 

nula H 0 H 0 


H 0 es verdadera 


H 0 es falsa 


Decisión 

Error 

correcta 

tipo 1 

Error 

Decisión 

tipo II 

correcta 


Paso 3: Se selecciona el estadístico de prueba 

Hay muchos estadísticos de prueba. En este capítulo se utilizan z y f como estadísticos de 
prueba. En otros capítulos aparecen estadísticos de prueba como F y x 2 , conocida como //- 
cuadrada. 


ESTADÍSTICO DE PRUEBA Valor, determinado a partir de la información de la muestra, para 
determinar si se rechaza la hipótesis nula. 


La prueba de hipótesis de la media (¡x), cuando se conoce a o el tamaño de la muestra es gran- 
de, es el estadístico de prueba z que se calcula de la siguiente manera: 


PRUEBA DE LA MEDIA CUANDO SE CONOCE <r 


X - ¡x 

(j/Vñ 


( 10 - 1 ) 

V 


El valor z se basa en la distribución muestral deX, que sigue la distribución normal cuando la 
muestra es razonablemente grande, con una media (|x*) igual a ¡x y una desviación estándar 
o> igual a o/vn. Por consiguiente, puede determinar si la diferencia entre X y ¡x es significati- 
va desde una perspectiva estadística al determinar el número de desviaciones estándares a 
las que se encuentra X de ¡x, con la fórmula (10.1). 

Paso 4: Se formula la regla de decisión 

Una regla de decisión es un enunciado sobre las condiciones específicas en que se rechaza 
la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define la ubi- 
cación de todos esos valores que son tan grandes o tan pequeños que la probabilidad de que 
ocurran en una hipótesis nula verdadera es muy remota. 

En la gráfica 10-1 se presenta la región de rechazo de una prueba de significancia que se 
efectuará más adelante en este capítulo. 
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Estadística en acción 

Durante la Segunda 
Guerra Mundial, los 
encargados de la planea- 
ción militar de los aliados 
necesitaban cálculos 
aproximados de la canti- 
dad de tanques alemanes. 
No era confiable la infor- 
mación que proporcio- 
naban los métodos de es- 
pionaje tradicionales, y, 
en cambio, los métodos 
estadísticos probaron ser 
muy valiosos. Por ejem- 
plo, el espionaje y el reco- 
nocimiento llevaron a los 
analistas a calcular que 
durante junio de 1941 se 
produjeron 1 550 tan- 
ques. Sin embargo, por 
medio de la utilización 
de los números de serie de 
los tanques capturados y 
el análisis estadístico, los 
encargados de la planea- 
ción militar calcularon 
244. La cantidad real de 
tanques producidos, de 
acuerdo con los registros 
de producción alemanes, 
fue de 271. El cálculo a 
través del análisis estadís- 
tico resultó ser mucho 
más preciso. Un tipo de 
análisis similar se empleó 
para calcular la cantidad 
de tanques iraquíes que 
fueron destruidos en la 
Tormenta del Desierto. 




GRÁFICA 10-1 


Distribución muestral del estadístico z; prueba de una cola a la derecha; nivel de 
significancia de 0.05 


Observe lo siguiente en la gráfica: 

• El área en que se acepta la hipótesis nula se localiza a la Izquierda de 1.65. En breve se 
explicará la forma de obtener el valor de 1 .65. 

• El área de rechazo se encuentra a la derecha de 1 .65. 

• Se aplica una prueba de una sola cola (este hecho también se explicará más adelante). 

• Se eligió el nivel de significancia de 0.05. 

• La distribución muestral del estadístico z tiene una distribución normal. 

• El valor 1 .65 separa las regiones en que se rechaza la hipótesis nula y en la que se acepta. 

• El valor de 1 .65 es el valor crítico. 


VALOR CRÍTICO Punto de división entre la región en que se rechaza la hipótesis nula y aquella 
en la que se acepta. 


Paso 5: Se toma una decisión 

El quinto y último paso en la prueba de hipótesis consiste en calcular el estadístico de la prue- 
ba, comparándola con el valor crítico, y tomar la decisión de rechazar o no la hipótesis nula. 
De acuerdo con la gráfica 10-1, si, a partir de la información de la muestra, se calcula que z 
tiene un valor de 2.34, se rechaza la hipótesis nula con un nivel de significancia de 0.05. La 
decisión de rechazar H 0 se tomó porque 2.34 se localiza en la reglón de rechazo; es decir, más 
allá de 1 .65. Se rechaza la hipótesis nula porque es poco probable que un valor z tan alto se 
deba al error de muestreo (azar). 

Si el valor calculado hubiera sido de 1 .65 o menos, supongamos 0.71 , la hipótesis nula no 
se habría rechazado. Un valor calculado tan bajo no se atribuye al azar, es decir, al error de 
muestreo. 

Como se Indicó, en la prueba de hipótesis sólo es posible una de las dos decisiones: la 
hipótesis nula se acepta o se rechaza. En lugar de aceptar la hipótesis nula, H 0 , algunos inves- 
tigadores prefieren expresar la decisión como “no se rechaza H 0 ", “se decide no rechazar H 0 " 
o “los resultados de la muestra no permiten rechazar H 0 ". 

Es necesario subrayar de nuevo que siempre existe la posibilidad de que la hipótesis nula 
se rechace cuando en realidad no se debe rechazar (error tipo I). Asimismo, existe una posibi- 
lidad definible de que la hipótesis nula se acepte cuando debiera rechazarse (error tipo II). 
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OA5 Distinguir entre 
las pruebas de hipótesis 
de una y dos colas. 


r ; ■ 

RESUMEN DE LOS PASOS DE LA PRUEBA DE HIPOTESIS 

1. Se establecen la hipótesis nula ( H 0 ) y la hipótesis alternativa (H-¡). 

2. Se selecciona el nivel de significancia, es decir, a. 

3. Se selecciona un estadístico de prueba adecuado. 

4. Se formula una regla de decisión con base en los pasos 1 , 2 y 3 anteriores. 

5. Se toma una decisión en lo que se refiere a la hipótesis nula con base en la información 
de la muestra. Se interpretan los resultados de la prueba. 


Antes de llevar a cabo una prueba de hipótesis, es importante diferenciar entre una prue- 
ba de significancia de una cola y una prueba de dos colas. 

10.5 Pruebas de significancia 
de una y dos colas 

Consulte la gráfica 1 0-1 . En ella se describe una prueba de una cola. La región de rechazo se 
localiza sólo en la cola derecha (superior) de la curva. Para ¡lustrarlo, suponga que el departa- 
mento de empaque de General Foods Corporation se preocupa porque algunas cajas de 
Grape Nuts exceden considerablemente el peso. El cereal se empaca en cajas de 453 gramos, 
por lo que la hipótesis nula es H 0 : |x < 453, que se lee: “la media poblacional (p.) es Igual o 
menor que 453”. Por consiguiente, la hipótesis alternativa es H 0 : p > 453, que se lee: “p es 
mayor que 453”. Observe que el signo de desigualdad en la hipótesis alternativa (>) señala 
hacia la reglón de rechazo ubicada en la cola superior. (Vea la gráfica 10-1.) También observe 
que la hipótesis nula incluye el signo igual. Es decir, H 0 : p < 453. La condición de igualdad 
siempre aparece en H 0 y jamás en . 

La gráfica 1 0-2 representa un caso en el que la región de rechazo se encuentra en la cola 
izquierda (inferior) de la distribución normal. Como ejemplo, considere el problema de los fabri- 
cantes de automóviles. Por ejemplo, las grandes compañías de renta de autos y otras empre- 
sas que compran grandes cantidades de neumáticos desean que duren un promedio de 
60 000 millas en condiciones normales. Por consiguiente, rechazarán un envío de neumáticos 
si las pruebas revelan que la vida de éstas es mucho menor a 60 000 millas en promedio. Con 
gusto aceptarán el envío si la vida media es mayor a 60 000 millas. Sin embargo, esta posibi- 
lidad no les preocupa. Sólo les interesa si cuentan con evidencias suficientes para concluir que 
los neumáticos tendrán un promedio de vida útil inferior a 60 000 millas. Por lo tanto, la prue- 
ba se plantea de manera que satisfaga la preocupación de los fabricantes de automóviles res- 
pecto de que la vida media de los neumáticos sea menor a 60 000 millas. Este enunciado 



GRAFICA 10-2 Distribución muestral del estadístico z, prueba de cola izquierda, nivel 


de significancia de 0.05 


10.6 Pruebas de la media de una población: se conoce la desviación estándar poblacional 
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La prueba es de una cola si 
W 1 afirma que jjl > o p. <. 


Si W, indica una dirección, la 
prueba es de una cola. 

H 0 : el ingreso medio anual de las corredoras de bolsa es menor o igual a $65 000. 

H 1 : el ingreso medio anual de las corredoras de bolsa es mayor a $65 000 anuales. 

Si no se especifica dirección alguna en la hipótesis alternativa, utilice una prueba de dos colas. 
Si cambia el problema anterior con fines de ilustración, puede decir lo siguiente: 

H 0 : el ingreso medio anual de las corredoras de bolsa es de $65 000 anuales. 

Hy. el ingreso medio anual de las corredoras de bolsa no es igual a $65 000 anuales. 

Si se rechaza la hipótesis nula y se acepta /-/ 1 en el caso de las dos colas, el ingreso medio 
puede ser significativamente mayor o inferior a $65 000 anuales. Para dar cabida a estas dos 
posibilidades, el área de 5% de rechazo se divide con equidad en las dos colas de la distribu- 
ción muestral (2.5% cada una). La gráfica 10-3 presenta las dos áreas y los valores críticos. 
Observe que el área total en la distribución normal es de 1 .0000, que se calcula por medio de 
0.9500 + 0.0250 + 0.0250. 


aparece en la hipótesis alternativa. En este caso, las hipótesis nula y alternativa se escriben 
H 0 : p, £ 60 000 y H^: p, < 60 000. 

Una manera para determinar la ubicación de la región de rechazo consiste en mirar en la 
dirección en la que señala el signo de desigualdad en la hipótesis alternativa (< o >). En este 
problema, señala a la izquierda, y, por consiguiente, la región de rechazo se localiza en la cola 
izquierda. 

En resumen, una prueba es de una cola cuando la hipótesis alternativa, indica una 
dirección, como: 



GRÁFICA 10-3 


Regiones de aceptación y rechazo de una prueba de dos colas con un nivel 
de significancia de 0.05 


10.6 Pruebas de la media de una población: 
se conoce la desviación 
estándar poblacional 

Prueba de dos colas 

Un ejemplo mostrará los detalles del procedimiento para probar una hipótesis en cinco pasos. 
También se desea usar una prueba de dos colas. Es decir, no interesa si los resultados de la 
muestra son más grandes o más pequeños que la media poblacional propuesta. Lo que inte- 
resa es si ésta es diferente del valor propuesto para la media poblacional. Como en el capítu- 
lo anterior, conviene iniciar con un caso del cual se cuente con un historial de datos sobre la 
población y, de hecho, se conozca la desviación estándar. 
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Cjemplo 


OA6 Llevar a cabo una 
prueba de hipótesis de una 
media poblacional. 


Solución 


( 10 - 1 ) 

Fórmula del estadístico de 
la prueba. 


Jamestown Steel Company fabrica y arma escrito- 
rios y otros muebles para oficina en diferentes 
plantas en el oeste del estado de Nueva York. La 
producción semanal del escritorio modelo A325 en 
la planta de Fredonia tiene una distribución normal, 
con una media de 200 y una desviación estándar 
de 16. Hace poco, con motivo de la expansión del 
mercado, se introdujeron nuevos métodos de pro- 
ducción y se contrató a más empleados. El vice- 
presidente de fabricación pretende investigar si 
hubo algún cambio en la producción semanal del 
escritorio modelo A325. En otras palabras, ¿la cantidad media de escritorios que se produje- 
ron en la planta de Fredonia es diferente de 200 escritorios semanales con un nivel de signifi- 
cancia de 0.01? 

En este ejemplo, tenemos dos datos importantes: 1) la población de la producción semanal 
sigue una distribución normal, y 2) la desviación estándar de esta distribución normal es de 16 
escritorios por semana. Por ello, es apropiado utilizar el estadístico z para resolver este proble- 
ma. Aplique el procedimiento de prueba de hipótesis estadística para investigar si cambió el 
índice de producción de 200 escritorios semanales. 

Paso 1: Se establecen las hipótesis nula y alternativa. La hipótesis nula es: “la media 
de la población es de 200”. La hipótesis alternativa es: “la media es diferente de 
200” o “la media no es de 200”. Estas dos hipótesis se expresan de la siguiente 
manera: 

H 0 : |x = 200 

|x + 200 

Ésta es una prueba de dos colas, pues la hipótesis alternativa no indica dirección 
alguna. En otras palabras, no establece si la producción media es mayor o menor 
a 200. El vicepresidente sólo desea saber si la tasa de producción es distinta de 
200 . 

Paso 2: Se selecciona el nivel de significancia. Como ya se indicó, se utiliza el nivel de 
significancia de 0.01 . Éste es a, la probabilidad de cometer un error tipo I, que es 
la probabilidad de rechazar una hipótesis nula verdadera. 

Paso 3: Se selecciona el estadístico de prueba. El estadístico de prueba de una mues- 
tra grande esz. Este tema se estudió lo suficiente en el capítulo 7. La transforma- 
ción de los datos de producción en unidades estándares (valores z) permite que 
se les utilice no sólo en este problema, sino en otros relacionados con la prueba 
de hipótesis. A continuación se repite la fórmula (10-1) para z y se identifican las 
diferentes letras. 




Paso 4: Se formula la regla de decisión. La regla de decisión se formula al encontrar los 
valores críticos de z con ayuda del apéndice B.l. Como se trata de una prueba 
de dos colas, la mitad de 0.01, o 0.005, se localiza en cada cola. Por consiguien- 
te, el área en la que no se rechaza H 0 , que se ubica entre las dos colas, es 0.99. 
El apéndice B.l se basa en la mitad del área bajo la curva, o 0.5000. Entonces, 
0.5000 - 0.0050 es 0.4950, por lo que 0.4950 es el área entre 0 y el valor crítico. 
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Se localiza 0.4950 en el cuerpo de la tabla. El valor más cercano a 0.4950 es 
0.4951 . En seguida se lee el valor crítico en el renglón y columna correspondien- 
tes a 0.4951. Éste es de 2.58. Por conveniencia, se repite el apéndice B.1, Áreas 
bajo la curva normal, en la tercera de forros. 

Todas las facetas de este problema aparecen en el diagrama de la gráfica 10-4. 



GRAFICA 10-4 Regla de decisión del nivel de significancia de 0.01 


Por lo tanto, la regla de decisión es: rechazar la hipótesis nula y aceptar la 
hipótesis alternativa (que indica que la media de la población no es 200) si el valor 
z calculado no se encuentra entre -2.58 y +2.58. La hipótesis nula no se recha- 
za si z se ubica entre -2.58 y +2.58. 

Paso 5: Se toma una decisión y se interpreta el resultado. Se toma una muestra de la 
población (producción semanal), se calcula z, se aplica la regla de decisión y se 
llega a la decisión de rechazar o no H 0 . La cantidad media de escritorios que 
se produjeron el año pasado (50 semanas, pues la planta cerró 2 semanas por 
vacaciones) es de 203.5. La desviación estándar de la población es de 16 escri- 
torios semanales. Al calcular el valor z a partir de la fórmula (10-1), se obtiene: 

X - ix 203.5 - 200 
Z_ o7W 16/V50 _1 ' 55 

Como 1 .55 no cae en la región de rechazo, H 0 no se rechaza. La conclusión 
es: la media de la población no es distinta de 200. Por lo tanto, se informa al vice- 
presidente de fabricación que la evidencia de la muestra no indica que la tasa de 
producción en la planta de Fredonia haya cambiado de 200 semanales. La dife- 
rencia de 3.5 unidades entre la producción semanal histórica y la del año pasado 
puede atribuirse razonablemente al error de muestreo. Esta información se resu- 
me en el siguiente diagrama: 
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CAPÍTULO 10 Pruebas de hipótesis de una muestra 


Comparación de intervalos de 
confianza y pruebas de hipó- 
tesis. 


Autoevaluación 10-1 



¿Se demostró que el ritmo de montaje aún es de 200 a la semana? No. Lo que se hizo, 
desde un punto de vista técnico, fue no desaprobar la hipótesis nula. No refutar la hipótesis de 
que la media poblacional es de 200 no es lo mismo que probar que necesariamente es verda- 
dera. Como se sugiere en la introducción del capítulo, la conclusión es análoga a la del siste- 
ma jurídico estadounidense. Para explicarlo, suponga que se acusa a una persona de un 
crimen, pero un jurado la absuelve. Si la persona es absuelta, se concluye que no había sufi- 
ciente evidencia para probar su culpabilidad. El juicio no probó que el individuo era necesaria- 
mente inocente, sino que no había suficiente evidencia para probar su culpabilidad. Eso 
evidencia las pruebas de hipótesis estadísticas cuando no se rechaza la hipótesis nula. La 
interpretación correcta consiste en que no se probó la falsedad de la hipótesis nula. 

En este caso se eligió el nivel de significancia de 0.01 antes de establecer la regla de deci- 
sión y tomar una muestra de la población. Ésta es la estrategia adecuada. El investigador debe 
establecer el nivel de significancia, pero debe determinarlo antes de reunir la evidencia de la 
muestra y no realizar cambios con base en la evidencia de ella. 

¿Cómo se confronta el procedimiento de prueba de hipótesis, recién descrito, con el pro- 
cedimiento de los intervalos de confianza que se estudió en el capítulo anterior? Al realizar la 
prueba de hipótesis en la producción de escritorios, se cambiaron las unidades de escritorios 
semanales a un valor z. Después se comparó el valor calculado del estadístico de la prueba 
(1.55) con el de los valores críticos (—2.58 y 2.58). Como el valor calculado se localizó en la 
región de no rechazo de la hipótesis nula, se concluyó que la media poblacional podía ser de 
200. Por otro lado, para aplicar el enfoque del intervalo de confianza, se debía construir un 
intervalo de confianza con la fórmula (9-1) (p. 302). El intervalo iría de 197.66 a 209.34, el cual 
se calcula de la siguiente manera: 203.5 ± 2.58(1 6/V50). Observe que el valor poblacional 
propuesto, 200, se encuentra en este intervalo. De ahí que la media poblacional podría ser, 
razonablemente, 200. 

En general, H 0 se rechaza si el intervalo de confianza no incluye el valor hipotético. Si el 
intervalo de confianza incluye el valor hipotético, no se rechaza H 0 . Así, la región de no recha- 
zo en una prueba de hipótesis equivale al valor poblacional propuesto en el intervalo de con- 
fianza. La diferencia fundamental entre un intervalo de confianza y la región de no rechazo en 
una prueba de hipótesis depende de que el intervalo se centre en torno al estadístico de la 
muestra, como X, al intervalo de confianza o alrededor de 0, como en la prueba de hipótesis. 



a) 

b ) 

c) 

d) 

e) 

f) 
3 ) 


Heinz, un fabricante de catsup, utiliza una máqui- 
na para vaciar 16 onzas de su salsa en botellas. A 
partir de su experiencia de varios años con la 
máquina despachadora, la empresa sabe que la 
cantidad del producto en cada botella tiene una 
distribución normal con una media de 16 onzas y 
una desviación estándar de 0.15 onzas. Una 
muestra de 50 botellas llenadas durante la hora 
pasada reveló que la cantidad media por botella 
era de 16.017 onzas. ¿Sugiere la evidencia que ia 
cantidad media despachada es diferente de 16 
onzas? Utilice un nivel de significancia de 0.05. 
Establezca la hipótesis nula y la hipótesis alternativa. 

¿Cuál es la probabilidad de cometer un error tipo I? 

Proporcione la fórmula del estadístico de la prueba. 

Enuncie la regla de decisión. 

Determine el valor del estadístico de la prueba. 

¿Cuál es su decisión respecto de la hipótesis nula? 

Interprete, en un enunciado, el resultado de la prueba estadística. 
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OA5 Distinguir entre las 
pruebas de hipótesis de una y 
dos colas. 


OA7 Calcular e interpretar 
el valor p. 


Prueba de una cola 

En el ejemplo anterior sólo se destacó el interés por informar al vicepresidente si ocurrió un 
cambio en la cantidad media de escritorios armados en la planta de Fredonia. No importaba 
si el cambio era un incremento o una disminución de la producción. 

Para ilustrar la prueba de una cola, vea otro problema. Suponga que el vicepresidente 
desea saber si hubo un incremento de la cantidad de unidades que se armaron. ¿Puede con- 
cluir, debido al mejoramiento de los métodos de producción, que la cantidad media de escri- 
torios que se ensamblaron en las pasadas 50 semanas fue superior a 200? Observe la 
diferencia al formular el problema. En el primer caso deseaba conocer si había una diferencia 
en la cantidad media armada; en cambio, ahora desea saber si hubo un incremento. Como se 
investigan diferentes cuestiones, se plantea la hipótesis de otra manera. La diferencia más 
importante se presenta en la hipótesis alternativa. Antes se enunció la hipótesis alternativa 
como “diferente de”; ahora se enuncia como “mayor que”. En símbolos: 

Prueba de dos colas: Prueba de una cola: 

H 0 \ |x = 200 H 0 : |x < 200 

H{. |x A 200 |i > 200 

Los valores críticos en una prueba de una cola son diferentes a los de una prueba de dos 
colas en el mismo nivel de significancia. En el ejemplo anterior, se dividió el nivel de significan- 
cia a la mitad y se colocó una mitad en la cola inferior y la otra en la cola superior. En una prue- 
ba de una cola, toda la región de rechazo se coloca en una cola. Vea la gráfica 10-5. 

En el caso de la prueba de una cola, el valor crítico es de 2.33, que se calcula: 1) se resta 
0.01 de 0.5000 y 2) se determina el valor z correspondiente a 0.4900. 



10.7 Valor p en la prueba de hipótesis 

Cuando se desea probar una hipótesis, se compara el estadístico de la prueba con un valor 
crítico. Se toma la decisión de rechazar la hipótesis nula o de no hacerlo. Así, por ejemplo, si 
el valor crítico es de 1 .96 y el valor calculado del estadístico de prueba es de 2.19, la decisión 
consiste en rechazar la hipótesis nula. 

En años recientes, debido a la disponibilidad del software de computadora, con frecuen- 
cia se da información relacionada con la seguridad del rechazo o aceptación. Es decir, ¿cuán- 
ta confianza hay en el rechazo de la hipótesis nula? Este enfoque indica la probabilidad (en el 
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Estadística en acción 

Existe una diferencia 
entre estadísticamente 
significativo y práctica- 
mente significativo. Para 
explicarlo, suponga que 
crea una nueva píldora 
para adelgazar y la prue- 
ba en 100 000 personas. 
Concluye que la persona 
común que toma la píl- 
dora durante dos años 
pierde una libra. ¿Cree 
usted que mucha gente 
se interesaría en tomar la 
píldora para perder una 
libra? Los resultados de 
ingerir la nueva píldora 
fueron estadísticamente 
significativos, pero no 


prácticamente significa- 
tivos. 
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supuesto de que la hipótesis nula sea verdadera) de obtener un valor del estadístico de la 
prueba por lo menos tan extremo como el valor real que se obtuvo. Este proceso compara 
la probabilidad, denominada valor p, con el nivel de significancia. SI el valor p es menor que 
el nivel de significancia, H 0 se rechaza. Si es mayor que el nivel de significancia, H 0 no se 
rechaza. 


VALOR p Probabilidad de observar un valor muestral tan extremo o más que el valor observa- 
do, si la hipótesis nula es verdadera. 


La determinación del valor p no sólo da como resultado una decisión respecto de H 0 , sino 
que brinda la oportunidad de observar la fuerza de la decisión. Un valor p muy pequeño, como 
0.0001 , indica que existe poca probabilidad de que H 0 sea verdadera. Por otra parte, un valor 
p de 0.2033 significa que H 0 no se rechaza y que existe poca probabilidad de que sea falsa. 

¿Cómo calcular el valor p? Para ilustrarlo se recurre al ejemplo en el que se probó la hipó- 
tesis nula relativa a que la cantidad de escritorios producidos a la semana en Fredonia fue de 
200. No se rechazó la hipótesis nula, pues el valor z de 1.55 cayó en la región comprendida 
entre -2.58 y 2.58. Se decidió no rechazar la hipótesis nula si el valor calculado de z caía en 
esta región. La probabilidad de hallar un valor z de 1.55 o más es de 0.0606, que se calcula 
mediante la diferencia de 0.5000 - 0.4394. En otras palabras, la probabilidad de obtener una 
X mayor de 203.5 si |x = 200 es de 0.0606. Para calcular el valor p, es necesario concentrar- 
se en la región menor a -1.55, así como en los valores superiores a 1.55 (pues la región de 
rechazo se localiza en ambas colas). El valor p de dos colas es de 0.1212, que se calcula así: 
2(0.0606). El valor p de 0.1212 es mayor que el nivel de significancia de 0.01 que se estable- 
ció al inicio, así que no se rechaza H 0 . En la siguiente gráfica se muestran los detalles. En 
general, el área se duplica en una prueba de dos colas. Entonces, el valor p se compara con 
facilidad con el nivel de significancia. Se aplica la misma regla de decisión en el caso de una 
prueba de una cola. 



Un valor p es una manera de expresar la probabilidad de que H 0 sea falsa. Pero, ¿cómo 
Interpretar un valor p? Ya se mencionó que si el valor p es menor que el nivel de significancia, 
se rechaza H 0 ; si es mayor que el nivel de significancia, no se la rechaza. Asimismo, si el valor 
p es muy grande, es probable que H 0 sea verdadera. Si el valor p es pequeño, es probable que 
H 0 no lo sea. El siguiente recuadro permite interpretar los valores p. 


INTERPRETACIÓN DE LA IMPORTANCIA DE LA EVIDENCIA EN CONTRA DE H 0 Si el valor p es menor 
que 

a) 0.10, hay cierta evidencia de que H 0 no es verdadera. 

b) 0.05, hay evidencia fuerte de que H 0 no es verdadera. 

c) 0.01 , hay evidencia muy fuerte de que H 0 no es verdadera. 

d) 0.001, hay evidencia extremadamente fuerte de que H 0 no es verdadera. 


10.7 Valor p en la prueba de hipótesis 


347 


r 


Autoevaluación 


10-2 


Consulte la autoevaluación 10-1. 

a) Suponga que se modifica el penúltimo enunciado para que diga: ¿La evidencia sugiere que la 
cantidad media despachada es mayor a 16 onzas? Establezca la hipótesis nula y la hipótesis 
alternativa en estas condiciones. 

b) ¿Cuál es la regla de decisión en las nuevas condiciones definidas en el inciso a)? 

c) Una segunda muestra de 50 contenedores llenos reveló que la media es de 16.040 onzas. ¿Cuál 
es el valor del estadístico de la prueba en esta muestra? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

e) Interprete, en un solo enunciado, el resultado de la prueba estadística. 

f) ¿Cuál es el valor p? ¿Cuál es su decisión respecto de la hipótesis nula con base en el valor p? 
¿Es la misma conclusión a la que se llegó en el inciso d)? 



comect 


Ejercicios 

Responda las siguientes preguntas en los ejercicios 1 a 4: a) ¿es una prueba de una o de dos colas?; 

b) ¿cuál es la regla de decisión?; c) ¿cuál es el valor del estadístico de la prueba?; d) ¿cuál es su deci- 
sión respecto de H 0 ?; e) ¿cuál es el valor p? Interprete este valor. 

1. Se selecciona una muestra de 36 observaciones de una población normal. La media muestral es 
de 49, y el tamaño de la muestra, de 36. La desviación estándar de la población es 5. Utilice el 
nivel de significancia de 0.05. 

H 0 \ = 50 

Hy p, =£ 50 

2. Se selecciona una muestra de 36 observaciones de una población normal. La media muestral es 
de 12, y el tamaño de la muestra, 36. La desviación estándar de la población es 3. Utilice el nivel 
de significancia 0.02. 

H 0 :^< 10 

Hy. p. > 10 

3. Se selecciona una muestra de 36 observaciones de una población normal. La media de la mues- 
tra es 21 , y la desviación estándar de la población, 5. Lleve a cabo la prueba de hipótesis con el 
nivel de significancia de 0.05. 

H 0 : < 20 

Hy |x >20 

4. Se selecciona una muestra de 64 observaciones de una población normal. La media de la mues- 
tra es 215, y la desviación estándar de la población, 15. Lleve a cabo la prueba de hipótesis, utili- 
ce el nivel de significancia 0.03. 

H 0 : |j. > 220 

Hy. |j. <220 

En el caso de los ejercicios 5 a 8: a) establezca la hipótesis nula y la hipótesis alternativa; b) defi- 
na la regla de decisión; c) calcule el valor del estadístico de la prueba; d) ¿cuál es su decisión res- 
pecto de /-/ 0 ?; e) ¿cuál es el valor p? Interprételo. 

5. El fabricante de neumáticos radiales con cinturón de acero X-1 5 para camiones señala que el milla- 
je medio que cada uno recorre antes de que se desgasten las cuerdas es de 60 000 millas. La des- 
viación estándar del millaje es de 5 000 millas. La Crosset Truck Company compró 48 neumáticos 
y comprobó que el millaje medio para sus camiones es de 59 500 millas. ¿La experiencia de 
Crosset es diferente de lo que afirma el fabricante en el nivel de significancia de 0.05? 

6. La cadena de restaurantes MacBurger afirma que el tiempo de espera de los clientes es de 8 minu- 
tos con una desviación estándar poblacional de 1 minuto. El departamento de control de calidad 
halló en una muestra de 50 clientes en Warren Road MacBurger que el tiempo medio de espera 
era de 2.75 minutos. Con el nivel de significancia de 0.05, ¿puede concluir que el tiempo medio 
de espera sea menor a 3 minutos? 

7. Una encuesta nacional reciente determinó que los estudiantes de secundaria veían en promedio 
(media) 6.8 películas en DVD al mes, con una desviación estándar poblacional de 0.5 horas. Una 
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muestra aleatoria de 36 estudiantes universitarios reveló que la cantidad media de películas en 
DVD que vieron el mes pasado fue de 6.2. Con un nivel de significancia de 0.05, ¿puede concluir 
que los estudiantes universitarios ven menos películas en DVD que los estudiantes de secun- 
daria? 

8. En el momento en que fue contratada como mesera en el Grumney Family Restaurant, a Beth 
Brigden le dijeron: “Puedes ganar en promedio más de $80 al día en propinas.” Suponga que la 
desviación estándar de la distribución de población es de $3.24. Los primeros 35 días de trabajar 
en el restaurante, la suma media de sus propinas fue de $84.85. Con el nivel de significancia de 
0.01, ¿la señorita Brigden puede concluir que gana un promedio de más de $80 en propinas? 

10.8 Prueba de la media poblacional: 
desviación estándar de la 
población desconocida 

En el ejemplo anterior se conocía a, la desviación estándar de la población. No obstante, en 
la mayoría de los casos, la desviación estándar de la población es desconocida. Por consi- 
guiente, a debe basarse en estudios previos o calcularse por medio de la desviación estándar 
de la muestra, s. La desviación estándar poblacional en el siguiente ejemplo no se conoce, por 
lo que se emplea la desviación estándar muestral para estimar cr. 

Para determinar el valor del estadístico de la prueba utilice la distribución t y modifique la 
fórmula (10.1) de la siguiente manera: 


PRUEBA DE UNA MEDIA; <r DESCONOCIDA 


X- [L 
s/Vñ 


( 10 - 2 ) 

J 


con n — 1 grados de libertad, donde: 

X representa la media de la muestra. 

|x, la media poblacional hipotética. 

s, la desviación estándar de la muestra. 

n, el número de observaciones incluidas en la muestra. 

Es una situación similar a cuando construyó intervalos de confianza en el capítulo anterior. Vea 
las páginas 306-312, capítulo 9. En la gráfica 9-3 de la página 309 se resumió el problema. En 
estas condiciones, el procedimiento estadístico correcto consiste en sustituir la distribución 
normal estándar con la distribución t. Para repasar las principales características de la distri- 
bución t: 

• Es una distribución continua. 

• Tiene forma de campana y es simétrica. 

• Existe una familia de distribuciones f; cada vez que se cambia de grados de libertad, se 
crea una nueva distribución. 

• Conforme se incrementa el número de grados de libertad, la forma de la distribución t se 
aproxima a la de la distribución normal estándar. 

• La distribución f es plana, o más dispersa, que la distribución normal estándar. 

El siguiente ejemplo muestra los detalles. 


Cjemplo 

El departamento de quejas de McFarland Insurance Company informa que el costo medio para 
tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es 


mayor que en las demás compañías de seguros, así que la compañía tomó medidas para redu- 
cir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del 
departamento de quejas seleccionó una muestra aleatoria de 26 quejas atendidas el mes pasa- 
do. La información de la muestra aparece a continuación. 
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Solución 


OA6 Llevar a cabo una 
prueba de hipótesis de una 
media poblacional. 
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¿Es razonable concluir que el costo medio de atención de una queja ahora es menor a $60 con 
un nivel de significancia de 0.01? 

Aplique la prueba de hipótesis con el procedimiento de los cinco pasos. 

Paso 1: Se establecen las hipótesis nula y alternativa. La hipótesis nula consiste en 
que la media poblacional es de por lo menos $60. La hipótesis alternativa consis- 
te en que la media poblacional es menor a $60. Se expresan las hipótesis nula y 
alternativa de la siguiente manera: 

H q : |x & $60 

/4 1 : |x < $60 

La prueba es de una cola, pues desea determinar si hubo una reducción en el 
costo. La desigualdad en la hipótesis alternativa señala la región de rechazo en la 
cola izquierda de la distribución. 

Paso 2: Se selecciona un nivel de significancia. El nivel de significancia es 0.01 . 

Paso 3: Se identifica el estadístico de la prueba. En este caso, el estadístico de la prue- 
ba es la distribución f. ¿Por qué? Primero, porque resulta razonable concluir que 
la distribución del costo por queja sigue la distribución normal. Puede confirmar- 
lo a partir del histograma a la derecha de la siguiente captura de pantalla de 
Minitab. Observe la distribución normal superpuesta en la distribución de fre- 
cuencias. 
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No se conoce la desviación estándar de la población, por lo que ésta se sustitu- 
ye por la desviación estándar de la muestra. El valor del estadístico de la prueba 
se calcula por medio de la fórmula (10-2): 


X - |x 
s/Vñ 
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Paso 4: Se formula una regla para tomar decisiones. Los valores críticos de t aparecen 
en el apéndice 13.2, una parte del cual se reproduce en la tabla 10-1. La columna 
extrema izquierda de la tabla está rotulada como gl, que representa los grados de 
libertad. El número de grados de libertad es el total de observaciones incluidas en 
la muestra menos el número de poblaciones muestreadas, lo cual se escribe 
n — 1 . En este caso, el número de observaciones de la muestra es de 26, y se 
muestrea una población, así que hay 26 - 1 = 25 grados de libertad. Para deter- 
minar el valor crítico, primero localice el renglón con los grados de libertad ade- 
cuados. Este renglón se encuentra sombreado en la tabla 1 0-1 . Luego determine 
si la prueba es de una o de dos colas. En este caso, es una prueba de una cola, 
asi que busque la sección de la tabla rotulada una cola. Localice la columna con 
el nivel de significancia elegido. En este ejemplo, el nivel de significancia es de 
0.01 . Desplácese hacia abajo por la columna rotulada 0.01 hasta intersecar el ren- 
glón con 25 grados de libertad. El valor es de 2.485. Como se trata de una prue- 
ba de una cola y la región de rechazo se localiza en la cola izquierda, el valor 
crítico es negativo. La regla de decisión consiste en rechazar H 0 si el valor de f es 
menor a -2.485. 

TABLA 10-1 Parte de la tabla de la distribución t 


Intervalos de confianza 


80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia de una prueba de una cola, a 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia de una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

3.819 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

3.792 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

3.768 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

3.745 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

3.725 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

3.707 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

3.690 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

3.674 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

3.659 

30 

1.310 

1.697 

2.042 

2.457 

2.750 

3.646 


Paso 5: Se toma una decisión y se interpreta el resultado. De acuerdo con la pantalla 
de Minitab, a la derecha del histograma, el costo medio por queja de la mues- 
tra de 26 observaciones es de $56.42. La desviación estándar de esta muestra es 
de $10.04. Al sustituir estos valores en la fórmula (10-2) y calcular el valor de t: 

X- p. $56.42 - $60 
f s/Vn $1 0.04/V26 

Como -1.818 se localiza en la región ubicada a la derecha del valor crítico de 
-2.485, la hipótesis nula no se rechaza con el nivel de significancia de 0.01. No 
se demostró que las medidas de reducción de costos hayan bajado el costo 
medio por queja a menos de $60. En otras palabras, la diferencia de $3.58 
($56.52 - $60) entre la media muestral y la media poblacional puede deberse al 
error de muestreo. El valor calculado de t aparece en la gráfica 10-6. Éste se 
encuentra en la región en que la hipótesis nula no se rechaza. 
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Cjemplo 


Solución 


OA6 Llevar a cabo una 
prueba de hipótesis de una 
media poblacional. 



GRAFICA 10-6 Reg ión de rechazo, distribución í, nivel de significancia 0.01 


En el ejemplo anterior, la media y la desviación estándar se calcularon con Minltab. El siguien- 
te ejemplo muestra los detalles cuando se calculan la media y la desviación estándar a partir 
de los datos de la muestra. 


La longitud media de una pequeña barra de contrapeso es de 43 milímetros. Al supervisor 
de producción le preocupa que hayan cambiado los ajustes de la máquina de producción de 
barras. Solicita una investigación al departamento de ingeniería, que selecciona una muestra 
aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados en milí- 
metros. 


42 

39 

42 

45 

43 

40 

39 

41 

40 

42 

43 

42 


¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de signifi- 
cancia 0.02. 


Primero formule la hipótesis nula y la hipótesis alternativa. 

H 0 : pl = 43 
Hy p, A 43 

La hipótesis alternativa no señala una dirección, así que se trata de una prueba de dos colas. 
Hay 1 1 grados de libertad, que se calculan por medio den-1 =12-1 =11. El valor t es de 

2.718, que se determina con el apéndice B.2 en el caso de una prueba de dos colas con un 
nivel de significancia de 0.02 y 11 grados de libertad. La regla de decisión es: se rechaza la 
hipótesis nula si el valor calculado de t se localiza a la izquierda de -2.718 o a la derecha de 

2.718. Esta información se resume en la gráfica 10-7. 



GRAFICA 10-7 Reg iones de rechazo, prueba de dos colas, distribución t de Student, a = 0.02 
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Se calcula la desviación estándar de la muestra con la fórmula (3-1 1). La media, X, es de 
41 .5 milímetros, y la desviación estándar, s, 1 .784 milímetros. Los detalles aparecen en la tabla 
10 - 2 . 

TABLA 10-2 Cálculos de la desviación estándar de la muestra 



Ahora puede calcular el valor de t con la fórmula (10-2). 


t = 


X- |x _ 41.5 - 43.0 
s/Vñ ~ 1.784/VT2 


= -2.913 


La hipótesis nula que afirma que la media poblacional es de 43 milímetros se rechaza por- 
que el valor calculado de t de —2.913 se encuentra en el área a la izquierda de -2.718. Se 
acepta la hipótesis alternativa y se concluye que la media poblacional no es de 43 milímetros. 
La máquina está fuera de control y necesita algunos ajustes. 


r 


Autoevaluación 


10-3 


La vida media de una batería de un reloj digital es de 305 días. Las vidas medias de las baterías se 
rigen por la distribución normal. Hace poco se modificó la batería para que tuviera mayor duración. 
Una muestra de 20 baterías modificadas exhibió una vida media de 31 1 días con una desviación 
estándar de 12 días. ¿La modificación incrementó la vida media de la batería? 

a) Formule la hipótesis nula y la hipótesis alternativa. 

b) Muestre la gráfica de la regla de decisión. Utilice el nivel de significancia 0.05. 

c) Calcule el valor de t. ¿Cuál es su decisión respecto de la hipótesis nula? Resuma sus resultados. 



comect 


Ejercicios 

9 . Sean las siguientes hipótesis: 

W 0 : F — 10 

H,: |i > 10 

En el caso de una muestra aleatoria de 10 observaciones seleccionada de una población normal, 
la media muestral fue de 12, y la desviación estándar de la muestra, de 3. Utilice el nivel de signi- 
ficancia 0.05: 

a) Formule la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión respecto de la hipótesis nula? 

10 . Sean las siguientes hipótesis: 

H 0 : |j. = 400 
Hy |J. * 400 
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En el caso de una muestra aleatoria de 12 observaciones seleccionada de una población normal, 
la media muestral fue de 407, y la desviación estándar de la muestra, de 6. Utilice el nivel de sig- 
nificancia 0.01 : 

a) Formule la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión respecto de la hipótesis nula? 

11. El gerente de ventas del distrito de las Montañas Rocallosas de Rath Publishing, Inc., editorial de 
textos universitarios, afirma que los representantes de ventas realizan en promedio 40 llamadas 
de ventas a la semana a profesores. Varios representantes señalan que el cálculo es muy bajo. Una 
muestra aleatoria de 28 representantes de ventas revela que la cantidad media de llamadas que 
se realizó la semana pasada fue de 42. La desviación estándar de la muestra es de 2.1 llamadas. 
Con el nivel de significancia de 0.05, ¿puede concluir que la cantidad media de llamadas semana- 
les por vendedor es de más de 40? 

12. La administración de White Industries analiza una nueva técnica para armar un carro de golf; la 
técnica actual requiere 42.3 minutos de trabajo en promedio. El tiempo medio de montaje de una 
muestra aleatoria de 24 carros, con la nueva técnica, fue de 40.6 minutos, y la desviación están- 
dar, de 2.7 minutos. Con un nivel de significancia de 0.10, ¿puede concluir que el tiempo de mon- 
taje con la nueva técnica es más breve? 

13. El ingreso promedio por persona en Estados Unidos es de $40 000, y la distribución de ingresos 
sigue una distribución normal. Una muestra aleatoria de 10 residentes de Wilmington, Delaware, 
presentó una media de $50 000, con una desviación estándar de $10 000. A un nivel de significan- 
cia de 0.05, ¿existe suficiente evidencia para concluir que los residentes de Wilmington, Delaware, 
ganan más que el promedio nacional? 

14. En la actualidad, la mayoría de quienes viajan por avión compra sus boletos por internet. De esta 
forma, los pasajeros evitan la preocupación de cuidar un boleto de papel, además de que las aero- 
líneas ahorran. No obstante, en fechas recientes, las aerolíneas han recibido quejas relacionadas 
con los boletos, en particular cuando se requiere hacer un enlace para cambiar de línea. Para ana- 
lizar el problema, una agencia de investigación independiente tomó una muestra aleatoria de 20 
aeropuertos y recogió información relacionada con la cantidad de quejas que hubo sobre los bole- 
tos durante marzo. A continuación se presenta la información. 


14 

14 

16 

12 

12 

14 

13 

16 

15 

14 

12 

15 

15 

14 

13 

13 

12 

13 

10 

13 


Con un nivel de significancia de 0.05, ¿la agencia de investigación puede concluir que la cantidad 
media de quejas por aeropuerto es menor de 15 al mes? 

a) ¿Qué suposición se requiere antes de llevar a cabo una prueba de hipótesis? 

b) Ilustre la cantidad de quejas por aeropuerto en una distribución de frecuencias o en un diagra- 
ma de dispersión. ¿Es razonable concluir que la población se rige por una distribución normal? 

c) Realice una prueba de hipótesis e interprete los resultados. 

Solución con software 

El sistema de software de estadística Minitab, que se utilizó en los capítulos precedentes y en 
la sección anterior, proporciona una forma eficaz de llevar a cabo una prueba de hipótesis de 
una cola para la media de la población. Los pasos para generar la siguiente captura de pan- 
talla aparecen en la sección de Comandos de software, al final del capítulo. 
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Una característica adicional de la mayoría de los paquetes de software consiste en que 
calculan el valor p, el cual proporciona más información sobre la hipótesis nula. El valor p es 
la probabilidad de un valor t tan extremo como el que se calculó, en caso de que la hipótesis 
nula sea verdadera. De acuerdo con los datos del ejemplo anterior, de la barra de contrapeso, 
el valor p de 0.014 es la probabilidad de un valor t de —2.91 o menor más la probabilidad de 
un valor t de 2.91 o mayor, con una media poblacional de 43. Así, la comparación del valor p 
con el nivel de significancia indica si la hipótesis nula se encontraba cerca de ser rechazada, 
si apenas se rechazó, etcétera. 

El siguiente diagrama contiene una explicación más detallada. El valor p de 0.014 es el 
área más oscura o sombreada, y el nivel de significancia es la totalidad del área sombreada. 
Como el valor p de 0.014 es menor que el nivel de significancia de 0.02, la hipótesis nula se 
rechaza. Si el valorp hubiera sido mayor que el nivel de significancia, 0.06, 0.19 o 0.57, la hipó- 
tesis nula no se habría rechazado. Si se hubiera elegido un valor de 0.01 para el nivel de sig- 
nificancia, la hipótesis nula no se habría rechazado. 



En el ejemplo anterior, la hipótesis alternativa era de dos colas, así que había áreas de 
rechazo tanto en la cola inferior (izquierda) como en la superior (derecha). Para calcular el valor 
p fue necesario determinar el área a la izquierda de -2.913 de una distribución f con 11 gra- 
dos de libertad y sumarla al valor del área a la derecha de 2.913, también con 11 grados de 
libertad. 

¿Y si se tratara de una prueba de una cola, de forma que toda la región de rechazo se 
localizara ya en la cola superior, ya en la cola inferior? En dicho caso, se indicaría un área a 
partir de una sola cola. En el ejemplo de la barra de contrapeso, si se definiera como 
(x < 43, la desigualdad apuntaría hacia la izquierda. Por consiguiente, se señalaría el valor p 
como el área a la izquierda de —2.913. Este valor es 0.007, que se calcula al dividir 0.014/2. 
Por lo tanto, el valorp de una prueba de una cola sería 0.007. 

¿Cómo calcular un valorp sin una computadora? Para ilustrarlo, recuerde que, en el ejem- 
plo relativo a la longitud de la barra de contrapeso, se rechazó la hipótesis nula que indicaba 


TABLA 10-3 Parte de la distribución t de Student 


Intervalos de confianza 


80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia de una prueba de una cola, a 

gi 

0.10 

0.05 

.0025 

0.01 

0.005 

0.0005 


Nivel de significancia de una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.781 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.587 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

4.437 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

4.318 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

4.221 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

4.140 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

4.073 
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que |x = 43 y se aceptó la hipótesis alternativa que indicaba que p. A 43. El nivel de signifi- 
cancia era de 0.02, así que, por lógica, el valor p es menor que 0.02. Para calcular el valor p 
con mayor precisión, vea el apéndice B.2 y localice el renglón con 1 1 grados de libertad. El 
valor calculado de t, 2.913, se localiza entre 2.718 y 3.106 (parte del apéndice B.2 se reprodu- 
ce en la tabla 10-3). El nivel de significancia de dos colas correspondiente a 2.718 es 0.02, y 
en el caso de 3.1 06, es 0.01 . Por lo tanto, el valor p se encuentra entre 0.01 y 0.02. Se acos- 
tumbra indicar que el valor p es menor que el mayor de los dos niveles de significancia. Así: 
“el valor p es menor que 0.02”. 



Se programa una máquina para llenar un frasco pequeño con 9.0 gramos de medicamento. Una 
muestra de ocho frascos arrojó las siguientes cantidades (en gramos) por botella. 


9.2 

8.7 

8.9 

8.6 

8.8 

8.5 

8.7 

9.0 


¿Puede concluir que el peso medio es inferior a 9.0 gramos si el nivel de significancia es de 0.01? 

a) Formule la hipótesis nula y la hipótesis alternativa. 

b) ¿Cuántos grados de libertad existen? 

c) Establezca la regla de decisión. 

d) Calcule el valor de t. ¿Qué decide respecto de la hipótesis nula? 

e) Estime el valor p. 


comect 


Ejercicios 

15. Sean las siguientes hipótesis: 

H 0 : p, > 20 
Hp p < 20 

Una muestra aleatoria de cinco elementos dio como resultado los siguientes valores: 18, 15, 12, 
1 9 y 21 . ¿Puede concluir que la media poblacional es menor que 20 con un nivel de significancia 
de 0.01? 

a) Establezca la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión en lo que se refiere a la hipótesis nula? 

d) Calcule el valor de p. 

16. Sean las siguientes hipótesis: 

H 0 : p = 1 00 
Hy |i. A 100 

Una muestra aleatoria de seis elementos dio como resultado los siguientes valores: 118, 105, 112, 
1 1 9, 1 05 y 1 1 1 . ¿Puede concluir que la media poblacional es diferente de 1 00 con un nivel de sig- 
nificancia de 0.05? 

a) Establezca la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión en lo que se refiere a la hipótesis nula? 

d) Calcule el valor de p. 

17. La cantidad de agua consumida al día por un adulto sano sigue una distribución normal, con una 
media de 1 .4 litros. Una campaña de salud promueve el consumo de cuando menos 2.0 litros dia- 
rios. Después de la campaña, una muestra de 10 adultos muestra el siguiente consumo en litros: 



1.5 

1.6 

1.5 

1.4 

1.9 

1.4 

1.3 

1.9 

1.8 

1.7 


A un nivel de significancia de 0.01, ¿se puede concluir que se ha elevado el consumo de agua? 
Calcule e interprete el valor p. 

18. El cloro líquido que se agrega a las albercas para combatir las algas tiene una duración relativa- 
mente corta en las tiendas antes de que pierda su eficacia. Los registros indican que la duración 
media de un frasco de cloro es de 2 1 60 horas (90 días). Como experimento, se agregó Holdlonger 
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al cloro para saber si éste incrementaba la duración del cloro. Una muestra de nueve frascos de 
cloro arrojó los siguientes tiempos de duración (en horas) en las tiendas: 


2 159 

2 170 

2 180 

2 179 

2 160 

2 167 

2 171 

2 181 

2 185 


¿Con el nivel de significancia de 0.025, ¿incrementó el Holdlonger la duración del cloro en las tien- 
das? Calcule el valor p. 

19 . Un grupo de expertos en Washington, D.C. anuncia que el adolescente típico envió 50 mensajes 
de texto por día durante 2009. Para actualizar la estimación, usted contacta por teléfono a una 
muestra de adolescentes y les pregunta cuántos mensajes enviaron el día anterior. Sus respues- 
tas fueron: 


51 

175 

47 

49 

44 

54 

145 

203 

21 

59 

42 

100 


A un nivel de significancia de 0.05, ¿puede concluir que el número medio es mayor a 50? Estime 
el valor p y describa qué le revela. 

20 . Hugger Polis afirma que un agente realiza una media de 53 entrevistas extensas a domicilio a la 
semana. Se introdujo un nuevo formulario para las entrevistas, y Hugger desea evaluar su eficacia. 
La cantidad de entrevistas extensas por semana de una muestra aleatoria de agentes es: 


53 57 50 55 58 54 60 52 59 62 60 60 51 59 56 


Con un nivel de significancia de 0.05, ¿puede concluir que la cantidad media de entrevistas de los 
agentes es más de 53 a la semana? Calcule el valor de p. 

10.9 Pruebas relacionadas con proporciones 

En el capítulo anterior se analizaron los intervalos de confianza para proporciones. Vea la sec- 
ción 9.4 en las páginas 313-316. También puede llevar a cabo una prueba de hipótesis de una 
proporción. Recuerde que una proporción es la razón entre el número de éxitos y el número de 
observaciones. Si X se refiere al número de éxitos y n al de observaciones, la proporción 
de éxitos en una cantidad fija de pruebas es X/n. Por consiguiente, la fórmula para calcular 
una proporción muestral, p, es p = X/n. Considere los siguientes casos de posibles pruebas 
de hipótesis. 

• Según sus registros, General Motors Informa que 70% de los vehículos rentados se 
devuelve con menos de 36 000 millas. Una muestra reciente de 200 vehículos devueltos 
al final de su periodo de renta mostró que 158 tenían menos de 36 000 millas. ¿Se Incre- 
mentó la proporción? 

• La American Assoclatlon of Retired Persons (AARP) informa que 60% de los retirados de 
menos de 65 años de edad regresaría a trabajar de tiempo completo si hubiera disponi- 
ble un trabajo adecuado. Una muestra de 500 retirados de menos de 65 años reveló que 
315 volverían a trabajar. ¿Puede concluir que más de 60% volvería a trabajar? 

• Able Moving and Storage, Inc., anuncia a sus clientes que el traslado a largas distancias 
de los bienes familiares se entregarán de 3 a 5 días a partir del momento de recogerlos. 
Los registros de Able muestran que han tenido éxito 90% de las veces. Una auditoría 
reciente mostró que de 200 veces, 190 tuvieron éxito. ¿La compañía puede concluir que 
aumentó este registro de éxitos? 

Se deben hacer algunas suposiciones antes de probar una proporción de población. Para 
probar una hipótesis relativa a una proporción de población, se elige una muestra aleatoria de 
ésta. Se supone que se satisfacen los supuestos binomiales del capítulo 6: 1) los datos de la 
muestra que se recogen son resultado de conteos; 2) el resultado de un experimento se cla- 
sifica en una de dos categorías mutuamente excluyentes —“éxito” o “fracaso” — ; 3) la proba- 
bilidad de un éxito es la misma para cada prueba; 4) las pruebas son independientes, lo cual 
significa que el resultado de una prueba no influye en el resultado de las demás. La prueba 
que realizará en breve es adecuada cuando ott y n(1 — -ir) son de al menos 5. El tamaño de la 
muestra es n, y tt, la proporción poblacional. Se tiene la ventaja de que una distribución bino- 
mial puede aproximarse por medio de la distribución normal. 


10.9 Pruebas relacionadas con proporciones 
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Cjemplo 


Solución 


Suponga que a partir de las elecciones anteriores en un estado, para que sea electo un candi- 
dato a gobernador, es necesario que gane por lo menos 80% de los votos de la zona norte. El 
gobernador de turno está interesado en evaluar sus posibilidades de volver al cargo y hace pla- 
nes para llevar a cabo una encuesta de 2 000 votantes registrados en esa región. 

Aplique el procedimiento para probar hipótesis y evalúe las posibilidades de que el gober- 
nador se reelija. 


Este caso de la reelección del gobernador satisface las condiciones binomiales. 

Sólo hay dos posibles resultados. Es decir, un votante entrevistado votará o no por el 
gobernador. 

La probabilidad de un éxito es la misma para cada prueba. En este caso, la probabilidad 
de que cualquier votante entrevistado apoye la reelección es de 0.80. 

Las pruebas son independientes. Esto significa, por ejemplo, que la probabilidad de que 
el votante 23 entrevistado apoye la reelección no resulta afectada por lo que hagan los 
votantes 24 y 52. 

Los datos de la muestra son el resultado de conteos. Vamos a contar el número de votan- 
tes que apoya la reelección en la muestra de 2 000. 


Se puede utilizar la aproximación normal de la distribución binomial que se analizó en el capí- 
tulo 7, pues mr y n(1 — tt) exceden de 5. En este caso, n = 2 000 y t r = 0.80 (tt es la propor- 
ción de votos en la parte norte del estado, u 80%, necesarios). Por lo tanto, mr = 2 000(0.80) 
= 1 600 y n(1 - tt) = 2 000(1 - 0.80) = 400. Ambos, 1 600 y 400, son mayores que 5. 


Paso 1: Se establecen las hipótesis nula y alternativa. La hipótesis nula, H 0 , consiste 
en que la proporción de la población tt es 0.80 o mayor. La hipótesis alternativa, 
H i, es que la proporción es menor a 0.80. Desde un punto de vista práctico, al 
gobernador de turno sólo le interesa cuando la proporción es menor de 0.80. Si 
es igual o mayor que 0.80, no pondrá objeciones; es decir, los datos de la mues- 
tra indicarían que probablemente se le reelija. Estas hipótesis se escriben simbó- 
licamente de la siguiente manera: 


H 0 : tt > .80 
tt < .80 


Hi establece una dirección. Por consiguiente, como se hizo notar antes, la prue- 
ba es de una cola, en la que el signo de desigualdad apunta a la cola de la distri- 
bución que contiene la región de rechazo. 

Paso 2: Se selecciona el nivel de significancia. El nivel de significancia es de 0.05. Ésta 
es la probabilidad de rechazar una hipótesis verdadera. 

Paso 3: Seleccione el estadístico de prueba. El estadístico adecuado es z, que se 
determina de la siguiente manera: 


PRUEBA DE HIPÓTESIS DE UNA PROPORCIÓN 



(10-3) 


y 


donde: 

tt es la proporción poblacional. 
p es la proporción de la muestra. 
n es el tamaño de la muestra. 

Determinación del valor Paso 4: Se formula la regla de decisión. El valor o los valores críticos de z forman el 

crítico. punto o puntos de división entre las regiones en las que se rechaza H 0 y en la que 

no se rechaza. Como la hipótesis alternativa indica una dirección, se trata de una 
prueba de una cola. El signo de la desigualdad apunta hacia la izquierda, así que 
sólo se utiliza el lado izquierdo de la curva. (Vea la gráfica 10-8.) El nivel de sig- 
nificancia del paso 2 fue de 0.05. Esta probabilidad se encuentra en la cola 
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GRAFICA 10-8 Región de rechazo del nivel de significancia de 0.05, prueba de una cola 


Se selecciona una muestra 
y se toma una decisión 
respecto de H 0 


izquierda y determina la región de rechazo. El área entre cero y el valor crítico es 
de 0.4500, que se calcula mediante 0.5000 - 0.0500. Y cuando se busca 0.4500 
en el apéndice B.1 , se halla que el valor crítico de z es 1 .65. Por lo tanto, la regla 
de decisión es: se rechaza la hipótesis nula y se acepta la hipótesis alternativa si 
el valor calculado de z cae a la izquierda de -1.65; de otra forma no se rechaza 
H 0 . 

Paso 5: Se toma una decisión y se interpreta el resultado. Se selecciona una muestra 
y se toma una decisión respecto de H 0 . Un sondeo de muestra de 2 000 posibles 
electores en la parte norte del estado reveló que 1 550 pensaban votar por el 
gobernador de turno. ¿Se encuentra la proporción de la muestra de 0.775 (calcu- 
lada con la operación 1 550/2 000) lo bastante cerca de 0.80 para concluir que la 
diferencia se debe al error de muestreo? En este caso: 

p tiene un valor de 0.775 y representa la proporción en la muestra que pla- 
nea votar por el gobernador. 

n tiene un valor de 2 000 y representa el número de votantes entrevis- 
tados. 

t r tiene un valor de 0.80 y representa la proporción de población hipoté- 
tica. 

z es un estadístico de prueba con una distribución normal cuando la hipó- 
tesis es verdadera y los demás supuestos son verdaderos. 

Con la fórmula (10-3) se calcula el valor dez: 

1 550 

- .80 

p - ir _ 2 000 _ .775 - .80 _ _ 9 Rn 

Z ~~ MI - tt) ~~ / .80(1 - .80) ~~ V. 00008 
V n V 2 000 


El valor calculado de z (-2.80) se encuentra en la región de rechazo, por lo 
que la hipótesis nula se rechaza en el nivel 0.05. La diferencia de 2.5 puntos por- 
centuales entre el porcentaje de la muestra (77.5%) y el porcentaje de la pobla- 
ción hipotética en la parte norte del estado que se requiere para ganar las 
elecciones estatales (80%) resulta estadísticamente significativa. Quizá no se 
deba a la variación muestral. En otras palabras, le evidencia no apoya la afirma- 
ción de que el gobernador de turno vuelva a su mansión otros cuatro años. 

El valor p es la probabilidad de hallar un valor z inferior a -2.80. De acuerdo 
con el apéndice B.1, la probabilidad de un valor de z entre cero y -2.80 es 
de 0.4974. Así, el valor p es 0.0026, que se determina con el cálculo de 0.5000 
- 0.4974. El gobernador no puede confiar en la reelección porque el valor p es 
inferior al nivel de significancia. 


10.10 Error tipo II 
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Autoevaluación 


10-5 



Un informe reciente de la industria de seguros indicó que 40% de las personas implicadas en acci- 
dentes de tránsito menores había tenido por lo menos un accidente los pasados cinco años. Un 
grupo de asesoría decidió investigar dicha afirmación, pues creía que la cantidad era muy grande. 
Una muestra de 200 accidentes de tránsito de este año mostró que 74 personas también estuvieron 
involucradas en otro accidente los pasados cinco años. Utilice el nivel de significancia 0.01. 

a) ¿Se puede emplear z como estadístico de la prueba? Indique la razón. 
ti) Formule la hipótesis nula y la hipótesis alternativa. 
ti) Muestre gráficamente la regla de decisión. 

d) Calcule el valor z y plantee su decisión respecto de la hipótesis nula. 

e) Determine e interprete el valor p. 


comect 


Ejercicios 

21. Sean las siguientes hipótesis: 

H 0 : it < .70 
H{. tt >.70 

Una muestra de 100 observaciones reveló que p = 0.75. ¿Puede rechazar la hipótesis nula en el 
nivel de significancia de 0.05? 

a) Formule la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión respecto de la hipótesis nula? 

22. Sean las siguientes hipótesis: 

H 0 : tt = .40 
Hy. tt -ti .40 

Una muestra de 120 observaciones reveló quep = 0.30. ¿Puede rechazar la hipótesis nula en el 
nivel de significancia de 0.05? 

a) Formule la regla de decisión. 

b) Calcule el valor del estadístico de prueba. 

c) ¿Cuál es su decisión respecto de la hipótesis nula? 

Nota: se recomienda utilizar el procedimiento de los cinco pasos de la prueba de hipótesis y resolver 
los siguientes problemas. 

23. El National Safety Council informó que 52% de los conductores estadounidenses que viajan por 
autopista de cuota es de género masculino. Una muestra de 300 automóviles que viajaron el día 
de ayer por la autopista de Nueva Jersey reveló que a 1 70 los manejaban hombres. Con un nivel de 
significancia de 0.01, ¿puede concluir que por la autopista de cuota de Nueva Jersey manejaba 
una proporción mayor de hombres que lo indicado por las estadísticas nacionales? 

24. Un artículo reciente de USA Today informó que sólo hay un trabajo disponible por cada tres nue- 
vos graduados de universidad. Las principales razones fueron una sobrepoblación de graduados 
universitarios y una economía débil. Una encuesta de 200 recién graduados reveló que 80 estu- 
diantes tenían trabajo. Con un nivel de significancia de 0.02, ¿puede concluir que una proporción 
mayor de estudiantes de su escuela tienen empleo? 

25. Chicken Delight afirma que 90% de sus pedidos se entrega en 10 minutos desde que se hace el 
pedido. Una muestra de 100 pedidos mostró que 82 se entregaron en el tiempo prometido. Con 
un nivel de significancia de 0.10, ¿puede concluir que menos de 90% de los pedidos se entregó 
en menos de 10 minutos? 

26. Una investigación de la Universidad de Toledo indica que 50% de los estudiantes cambia de área 
de estudios después del primer año. Una muestra aleatoria de 100 estudiantes de la Facultad de 
Administración reveló que 48 habían cambiado de área de estudio después del primer año del pro- 
grama de estudios. ¿Hubo una reducción significativa en la proporción de estudiantes que cambian 
de área el primer año en este programa? Realice una prueba con un nivel de significancia de 0.05. 


10.10 Error tipo II 

OA9 Calcular la Recuerde que el nivel de significancia, identificado con el símbolo a, es la probabilidad de que 

probabilidad de un error la hipótesis nula se rechace cuando es verdadera. Esto recibe el nombre de error tipo I. Los 

tipo II. niveles de significancia más comunes son 0.05 y 0.01 , y los establece el investigador desde el 

inicio de la prueba. 
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En un caso de prueba de hipótesis también existe la posibilidad de que no se rechace una 
hipótesis nula cuando en realidad es falsa. Es decir, se acepta una hipótesis nula falsa. Esto 
recibe el nombre de error tipo II. La probabilidad de un error tipo II se identifica con la letra 
griega beta ((3). Los siguientes ejemplos ilustran los detalles de la determinación del valor de (3. 


Cjemplo 


Western Wire Products compra barras de acero para hacer clavijas. La experiencia indica que 
la fuerza media de tensión de las cargas que llegan es de 10 000 psi, y que la desviación están- 
dar, a, es de 400 psi. 

Con el fin de tomar una decisión sobre las cargas de barras de acero que llegan, el fabri- 
cante establece la siguiente regla para que el inspector de control de calidad se apegue a ella: 
“Tome una muestra de 100 barras de acero. Si la fuerza media (X) se encuentra entre 9 922 y 
10 078 psi con un nivel de significancia de 0.05, acepte el lote. De lo contrario, debe rechazar- 
lo.” La gráfica 10-9, región A, muestra la región en que se rechaza cada lote y en la que no se 
rechaza. La media de esta distribución se representa mediante |jl 0 . Las colas de la curva repre- 
sentan la probabilidad de cometer un error tipo I, es decir, de rechazar el lote de barras de acero 
que ingresa cuando, en realidad, se trata de un buen lote, con una media de 10 000 psi. 



Suponga que la media poblacional desconocida de un lote que llega, designada |x, es en 
realidad de 9 900 psi. ¿Cuál es la probabilidad de que el inspector de control de calidad no 
rechace la carga (error tipo II)? 


Solución 


La probabilidad de cometer un error tipo II, según representa el área sombreada en la gráfica 
1 0-9, región B, se calcula al determinar el área bajo la curva normal que se localiza sobre 9 922 
libras. El cálculo de las áreas bajo la curva normal se analizó en el capítulo 7. Un breve repaso: 
es necesario determinar primero la probabilidad de que la media muestral caiga entre 9 900 y 
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9 922. Después, se resta esta probabilidad de 0.5000 (que representa toda el área más allá de 
la media de 9 900) para llegar a la probabilidad de cometer un error tipo II en este caso. 

El número de unidades estándares (valor de z) entre la media del lote que llega (9 900), 
designada p-,, y X que representa el valor crítico de 9 922, se calcula de la siguiente manera: 


ERROR TIPO II 


z = 


X c ~ p-1 
o/Vn 


(10-4) 


Si n = 1 00 y o = 400, el valor de z es 0.55: 

X c - pn 9 922 - 9 900 22 


z = 


o/Vn 400/VTOÜ 


40 


= 0.55 


El área bajo la curva entre 9 900 y 9 922 (un valor z de 0.55) es 0.2088. El área bajo la curva 
más allá de 9 922 libras es 0.5000 - 0.2088 o 0.291 2; tal es la probabilidad de cometer un error 
tipo II, es decir, de aceptar el ingreso de un lote de barras de acero cuando la media poblacio- 
nal es de 9 900 psi. 

Otra ilustración, en la gráfica 10-10, región C, describe la probabilidad de aceptar un lote 
cuando la media poblacional es de 10 120. Para determinar la probabilidad: 


z = 


X c - ph 10 078 - 10 120 
o/Vn ~ 400/V100 


= -1.05 


La probabilidad de que z sea menor que —1.05 es 0.1469, que se determina al calcular 0.5000 
— 0.3531 . Por lo tanto, (3, o la probabilidad de cometer un error tipo II, es 0.1 469. 


Región A 




Región C 


psi 


GRÁFICA 10-10 Errores tipo I y tipo II (otro ejemplo) 



362 


CAPÍTULO 10 Pruebas de hipótesis de una muestra 


De acuerdo con las técnicas que se ilustran en las gráficas 10-9, región B, y 10-10, región 
C, puede determinarse la probabilidad de aceptar una hipótesis como verdadera cuando en 
realidad es falsa para cualquier valor de |jl 1 . 

Las probabilidades de cometer un error tipo II aparecen en la columna central de la tabla 
10-4 para valores selectos de jjl, dados en la columna de la izquierda. La columna derecha pro- 
porciona la probabilidad de no cometer un error tipo II, que también se conoce como la fuerza 
de una prueba. 

TABLA 10- Probabilidades de cometer un error tipo II con |Xo = 10 000 libras y medias alternativas 
seleccionadas, nivel de significancia 0.05 


Media 

alternativa 

seleccionada 

(libras) 

Probabilidad 
de cometer 
un error tipo II 
(P) 

Probabilidad 
de no cometer 
un error tipo II 
(1 - P) 

9 820 

.0054 

.9946 

9 880 

.1469 

.8531 

9 900 

.2912 

.7088 

9 940 

.6736 

.3264 

9 980 

.9265 

.0735 

10 000 

* 

— 

10 020 

.9265 

.0735 

10 060 

.6736 

.3264 

10 100 

.2912 

.7088 

10 120 

.1469 

.8531 

10 180 

.0054 

.9946 


* No es posible cometer un error tipo II cuando p, = p 0 . 


Autoevaluación 10-6 Repase el ejemplo anterior. Suponga que la media real de un lote de barras de acero que llega es 
de 10 180 psi. ¿Cuál es la probabilidad de que el inspector de control de calidad acepte las barras 
como si tuvieran una media de 10 000 psi? (Parece poco probable que las barras de acero se 
rechacen si la fuerza de tensión es mayor que la especificada. No obstante, puede ser que la clavija 
tenga una doble función en un motor fuera de borda. Tal vez esté diseñada para que no se des- 
prenda si el motor golpea un objeto pequeño, aunque sí lo haga si golpea una roca. Por consiguien- 
te, el acero no debe ser demasiado fuerte.) 

El área no sombreada de la gráfica 10-10, región C, representa la probabilidad de aceptar por 
error la hipótesis que indica que la fuerza de tensión media de las barras de acero es de 10 000 psi. 
¿Cuál es la probabilidad de cometer un error tipo II? 



comed 


Ejercicios 

27. Consulte la tabla 10-4 y el ejemplo anterior. Si n = 100, cr = 400, X c = 9 922 y |jl 1 = 9 880, verifi- 
que que la probabilidad de cometer un error tipo II sea de 0.1469. 

28. Consulte la tabla 10-4 y el ejemplo anterior. Si n = 100, cr = 400, X c = 9 922 y p.-, = 9 940, verifi- 
que que la probabilidad de cometer un error tipo II sea de 0.6736. 


Resumen del capítulo 

I. El objetivo de la prueba de hipótesis consiste en verificar la validez de una afirmación relacionada 
con un parámetro de la población. 

II. Los pasos para llevar a cabo una prueba de hipótesis son los siguientes: 

A. Se formula la hipótesis nula ( H 0 ) y la hipótesis alternativa (/-/-,). 

B. Se selecciona el nivel de significancia. 

1. El nivel de significancia es la probabilidad de rechazar una hipótesis nula verdadera. 

2. Los niveles de significancia más frecuentes son 0.01, 0.05 y 0.10, pero es posible cualquier 
valor entre 0 y 1 .00. 



Clave de pronunciación 
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C. Se selecciona el estadístico de prueba. 

1. Un estadístico de prueba es un valor que se calcula a partir de la información de una mues- 
tra para determinar si se rechaza la hipótesis nula. 

2. En este capítulo se consideraron dos estadísticos de prueba. 

a) La distribución normal estándar se utiliza cuando la población sigue la distribución normal 
y se conoce la desviación estándar de la población. 

b) La distribución t de Student se emplea cuando la población sigue la distribución normal y 
se desconoce la desviación estándar de la población. 

D. Se establece la regla de decisión. 

1. La regla de decisión indica la condición o condiciones en que se rechaza la hipótesis nula. 

2. En una prueba de dos colas, la región de rechazo se divide uniformemente entre las colas 
izquierda y derecha de la distribución. 

3. En una prueba de una cola, toda la región de rechazo se encuentra en la cola izquierda o 
en la cola derecha. 

E. Se selecciona una muestra, se calcula el valor del estadístico de la prueba, se toma una deci- 
sión respecto de la hipótesis nula y se interpretan los resultados. 

III. Un valor p es la probabilidad de que el valor del estadístico de prueba sea tan extremo como el 
valor calculado cuando la hipótesis nula es verdadera. 

IV. Al probar una hipótesis sobre la media de la población: 

A. Si se conoce la desviación estándar de la población, a, el estadístico de prueba es la distribu- 
ción normal estándar, y se determina a partir de: 


z = 


X - ^ 
cr/Vñ 


( 10 - 1 ) 


B. Si no se conoce la desviación estándar de la población, pero hay por lo menos 30 observacio- 
nes en la muestra, s se sustituye por a. El estadístico de prueba es la distribución f, y su valor 
se determina de acuerdo con: 


f = 


X - ^ 

s/Vñ 


( 10 - 2 ) 


Las principales características de la distribución t de Student son: 

1. Es una distribución continua. 

2. Tiene forma de campana y es simétrica. 

3. Es plana o más amplia que la distribución normal estándar. 

4. Existe una familia de distribuciones t, según el número de grados de libertad. 

V. Cuando se prueba la proporción de una población: 

A. Deben cumplirse las condiciones binomiales. 

B. Tanto mr como n(1 - tt) deben ser al menos 5. 

C. El estadístico de prueba es 


z = 


P 7T 





n 


VI. Existen dos tipos de errores que se pueden presentar en una prueba de hipótesis. 

A. Un error tipo I, cuando se rechaza una hipótesis nula. 

1. La probabilidad de cometer un error tipo I es igual al nivel de significancia. 

2. Esta probabilidad se designa con la letra griega a. 

B. Un error tipo II, cuando no se rechaza una hipótesis nula falsa. 

1. La probabilidad de cometer un error tipo II se designa con la letra griega p. 

2. La probabilidad de cometer un error tipo II se determina por medio de 

_ X c - p.1 
cr/Vñ 


(10-3) 


(10-4) 


Clave 

de pronunciación 


SÍMBOLO 

SIGNIFICADO 

PRONUNCIACIÓN 

H 0 

Hipótesis nula 

H, subíndice cero 

Hi 

Hipótesis alternativa 

H, subíndice uno 

a/2 

Nivel de significancia de dos colas 

Alfa sobre 2 

Xc 

Límite de la media muestral 

X barra, subíndice c 

h-0 

Media supuesta de la población 

Mu, subíndice cero 
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comed: 


ejercicios del copítulo 

29. De acuerdo con el presidente del sindicato local, el ingreso bruto medio de los plomeros en el área 
de Salt Lake City sigue la distribución de probabilidad normal con una media de $45 000 y una 
desviación estándar de $3 000. Un reportaje de investigación reciente de KYAK TV reveló que el 
ingreso bruto medio de una muestra de 120 plomeros era de $45 500. ¿Es razonable concluir que 
el ingreso medio no es igual a $45 000 en el nivel de significancia de 0.10? Determine el valor p. 

30 . Rutter Nursery Company empaca su aserrín de pino en bolsas de 50 libras. Desde hace tiempo, el 
departamento de producción informa que la distribución de pesos de las bolsas se rige por una 
distribución normal y que la desviación estándar del proceso es de 3 libras por bolsa. Al final de 
cada día, Jeff Rutter, gerente de producción, pesa 10 bolsas y calcula el peso medio de la mues- 
tra. En seguida aparecen los pesos de 10 bolsas de la producción de hoy. 


45.6 

47.7 

47.6 

46.3 

46.2 

47.4 

49.2 

55.8 

47.5 

48.5 


a) ¿Puede concluir Rutter que el peso medio de las bolsas es inferior a 50 libras? Utilice el nivel 
de significancia 0.01 . 

ib) Indique en un breve informe la razón por la que Rutter puede utilizar la distribución z como esta- 
dístico de prueba, 
c) Calcule el valor p. 

31 . Una nueva compañía dedicada al control de peso, Weight Reducers International, anuncia que 
quienes ingresan perderán, en promedio, 10 libras las primeras dos semanas, con una desviación 
estándar de 2.8 libras. Una muestra aleatoria de 50 personas que iniciaron el programa de reduc- 
ción de peso reveló que el peso medio perdido fue de 9 libras. Con un nivel de significancia de 
0.05, ¿puede concluir que quienes ingresan a Weight Reducers perderán en promedio más de 10 
libras? Determine el valor p. 

32 . Dole Pineapple, Inc., está preocupada porque supone que las latas de 16 onzas de piña tengan 
producto en exceso. Suponga que la desviación estándar del proceso es de 0.03 onzas. El depar- 
tamento de control de calidad tomó una muestra aleatoria de 50 latas y halló que la media aritmé- 
tica del peso era de 16.05 onzas. ¿Puede concluir que el peso medio es mayor a 16 onzas con un 
nivel de significancia de 5%? Determine el valor p. 

33. De acuerdo con una encuesta reciente, los estadounidenses duermen un promedio de 7 horas por 
noche. Una muestra aleatoria de 50 estudiantes de West Virginia University reveló que la cantidad 
media de horas que durmieron la noche anterior fue de 6 horas, 48 minutos (6.8 horas). La desvia- 
ción estándar de la muestra fue de 0.9 horas. ¿Es razonable concluir que los estudiantes de West 
Virginia duermen menos que el estadounidense normal? Calcule el valor p. 

34 . Una agencia estatal de venta de bienes raíces, Farm Associates, se especializa en la venta de 
granjas en el estado de Nebraska. Sus registros indican que el tiempo medio de venta de una gran- 
ja es de 90 días. Como consecuencia de las recientes sequías, la agencia cree que el tiempo medio 
de venta es superior a 90 días. Una encuesta reciente en 100 granjas de todo el estado mostró 
que el tiempo medio de venta fue de 94 días, con una desviación estándar de 22 días. A un nivel 
de significancia de 0.10 ¿aumentó el tiempo de venta? 

35 . De acuerdo con la Oficina del Censo, 3.13 personas residen en un típico hogar estadounidense. 
Una muestra de 25 hogares de las comunidades de retirados de Arizona mostró que el número 
medio de residentes por hogar era de 2.86 personas. La desviación estándar de esta muestra 
es de 1.20 residentes. A un nivel de significancia de 0.05, ¿es razonable concluir que el número 
medio de residentes en los hogares de las comunidades de retirados es menos a 3.13 personas? 

36 . Un artículo reciente en la revista Vitality informó que la cantidad media de tiempo de descanso 
semanal de los estadounidenses es de 40.0 horas. Usted piensa que la cifra es muy alta y decide 
llevar a cabo sus propias pruebas. En una muestra aleatoria de 60 hombres, descubre que la 
media es de 37.8 horas de descanso a la semana, con una desviación estándar de la muestra de 
12.2 horas. ¿Puede concluir que la información del artículo es incorrecta? Utilice el nivel de signi- 
ficancia 0.05. Determine el valor p y explique su significado. 

37 . En años recientes, la tasa de interés de los créditos hipotecarios se redujo a menos de 6.0%. Sin 
embargo, de acuerdo con un estudio llevado a cabo por la Junta de Gobernadores de la Reserva 
Federal de Estados Unidos, la tasa de los cargos a las tarjetas de crédito es superior a 14%. En la 
siguiente lista aparece la tasa de los cargos a una muestra de 10 tarjetas de crédito. 


14.6 

16.7 

17.4 

17.0 

17.8 

15.4 

13.1 

15.8 

14.3 

14.5 
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¿Resulta razonable concluir que la tasa media es superior a 14%? Utilice el nivel de significancia 
0 . 01 . 

38 . Un artículo reciente de The Wall Street Journal informó que en la actualidad la tasa hipotecaria a 
30 años es inferior a 6%. Una muestra de ocho bancos pequeños de la región central de Estados 
Unidos reveló las siguientes tasas (porcentuales) a 30 años: m 


4.8 

5.3 

6.5 

4.8 

6.1 

5.8 6.2 

5.6 


Con un nivel de significancia de 0.01, ¿puede concluir que la tasa hipotecaria a 30 años de los 
bancos pequeños es inferior a 6%? Calcule el valor p. 

39 . De acuerdo con la Coffee Research Organization (http://www.coffeeresearch.org), el bebedor 
estadounidense habitual de café consume un promedio de 3.1 tazas al día. Una muestra de 12 per- 
sonas de la tercera edad reveló que el día de ayer consumieron las siguientes cantidades de café, 
expresadas en tazas: m 


3.1 

3.3 

3.5 

2.6 

2.6 

4.3 

4.4 

3.8 3.1 

4.1 

3.1 

3.2 


¿Los datos sugieren que existe una diferencia entre el promedio nacional y la media de la mues- 
tra tomada de las personas de la tercera edad, con un nivel de significancia de 0.05? 

40 . Hace poco se amplió el área de recuperación del hospital St. Luke, de Maumee, Ohio. Se espera- 
ba que con la ampliación la cantidad media de pacientes al día fuera mayor de 25. Una muestra 
aleatoria de 15 días reveló las siguientes cantidades de pacientes. 


25 

27 

25 

26 

25 

28 

28 

27 

24 

26 

25 

29 

25 

27 

24 


Con un nivel de significancia de 0.01, ¿puede concluir que la cantidad media de pacientes al día 
es mayor a 25? Calcule el valor p e interprételo. 

41 . eGolf.com recibe un promedio de 6.5 devoluciones al día de compradores en línea. En el caso de 
una muestra de 12 días, recibió el siguiente número de devoluciones: m 


04349459167 10 


¿Puede concluir que la cantidad media de devoluciones es inferior a 6.5, con un nivel de signifi- 
cancia de 0.01? 

42 . En temporadas recientes, la Liga Mayor de Béisbol ha sido criticada por la duración de los juegos. 
Un informe indica que el juego promedio dura 3 horas, 30 minutos. Una muestra de 1 7 juegos reve- 
ló los siguientes tiempos de juego (observe que los minutos se convirtieron en fracciones de hora, 
de manera que un juego que duró 2 horas, 24 minutos, se expresa como 2.40 horas). 


2.98 2.40 2.70 2.25 3.23 3.17 2.93 3.18 2.80 

2.38 3.75 3.20 3.27 2.52 2.58 4.45 2.45 

117 

¿Puede concluir que el tiempo medio de un juego es menor de 3.50 horas? Utilice el nivel de sig- 
nificancia de 0.05. 

43 . Watch Corporation de Suiza afirma que, en promedio, sus relojes jamás se atrasan o adelantan 
durante una semana. Una muestra de 18 relojes arrojó los siguientes adelantos (+) o atrasos (-) 
en segundos por semana. 


-0.38 

-0.20 

-0.38 

-0.32 

+ 0.32 

-0.23 

+ 0.30 

+ 0.25 

-0.10 

-0.37 

-0.61 

-0.48 

-0.47 

-0.64 

-0.04 

-0.20 

-0.68 

+ 0.05 


¿Es razonable concluir que el adelanto o atraso medio de tiempo de los relojes es de 0? Utilice el 
nivel de significancia 0.05. Calcule el valor p. 

44 . En la tabla siguiente aparecen los índices de recuperación (porcentual) de un año de una muestra 
de 12 fondos mutualistas clasificados como fondos gravables del mercado monetario. 


4.63 

4.15 

4.76 

4.70 

4.65 

4.52 

4.70 

5.06 

4.42 

4.51 

4.24 

4.52 
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Con un nivel de significancia de 0.05, ¿es razonable concluir que los índices de recuperación son 
de 4.50%? 

45 . Muchos supermercados y grandes tiendas de menudeo, como Wal-Mart y K-Mart, instalaron sis- 
temas de autopago con el fin de que los clientes registren sus artículos y los paguen. ¿Les gusta 
este servicio a los clientes? ¿Con qué frecuencia lo utilizan? En seguida aparece la cantidad de 
clientes que utilizan el servicio en una muestra de 1 5 días en la tienda Wal-Mart en la carretera 544 
en Surfside, Carolina del Sur. 


120 

108 

120 

114 

118 

91 

118 

92 

104 

104 

112 

97 

118 

108 

117 







¿Es razonable concluir que la cantidad media de clientes que utiliza el sistema de autopago supe- 
ra los 100 diarios? Utilice el nivel de significancia 0.05. 

46 . En un año reciente, ia tarifa media para viajar en avión de Charlotte, Carolina del Norte, a Seattle, 
Washington, con un boleto de descuento fue de $267. El mes pasado, una muestra aleatoria de 
tarifas de descuento para viajes redondos en esta ruta arrojó los siguientes datos: 


$321 $286 $290 $330 $310 $250 $270 $280 $299 $265 $291 $275 $281 


A un nivel de significancia 0.01 ¿Puede concluir que la tarifa media se incrementó? ¿Cuál es el 
valor p? 

47 . El editor de Celebrity Living afirma que las ventas medias de revistas de personalidad en las que 
aparecen personajes como Angelina Jolie o Paris Hilton venden 1.5 millones de ejemplares a la 
semana. Una muestra de 10 títulos comparables arroja ventas medias semanales de la semana 
pasada de 1 .3 millones de ejemplares, con una desviación estándar de 0.9. ¿Estos datos contra- 
dicen lo que afirma el editor? Utilice un nivel de significancia 0.01. 

48 . Un informe de Naciones Unidas muestra que el ingreso medio familiar de inmigrantes mexicanos 
en Estados Unidos es de $27 000 al año. Una evaluación del FLOC (Farm Labor Organizing 
Committee) de 25 familias mexicanas reveló una media de $30 000, con una desviación estándar 
de $10 000. ¿Esta información discrepa con el informe de Naciones Unidas? Aplique un nivel de 
significancia 0.01 . 

49 . En la mayoría de los deportes se acostumbra lanzar una moneda para decidir qué equipo obtiene 
la pelota primero. Esto requiere de poco esfuerzo y se cree que concede la misma oportunidad a 
ambos equipos. En los juegos del Súper Tazón 43, la National Football Conference ha ganado 
estos “volados” 29 veces, mientras que la American Football Conference sólo ha ganado 14 veces. 
Utilice el procedimiento de cinco pasos de prueba de la hipótesis y un nivel de significancia de 
0.01 para probar si estos datos sugieren que es justo lanzar la moneda. 

a) ¿Por qué es posible emplear z como el estadístico de prueba? 

b) Establezca las hipótesis nula y alternativa. 

c) Elabore un diagrama de la regla de decisión, 
e) ¿Cuál es el valor p y qué es lo que implica? 

50 . De acuerdo con un estudio de la American Pet Food Dealers Association, 63% de las familias esta- 
dounidenses tiene mascotas. Se prepara un informe para una editorial del San Francisco Chro- 
nicle. Como parte del editorial, una muestra aleatoria de 300 familias mostró que poseía mascotas. 
¿Estos datos contradicen los de la Pet Food Dealers Association? Aplique un nivel de significan- 
cia 0.05. 

51 . Tina Dennis es contralora de Meek Industries y cree que el problema actual de flujo de efectivo en 
Meek es consecuencia de la tardanza en el cobro de cuentas. Dennis cree que la liquidación de 
más de 60% de las cuentas tarda más de tres meses. Una muestra aleatoria de 200 cuentas reve- 
ló que 140 tenían más de tres meses de antigüedad. Con un nivel de significancia de 0.01 ¿puede 
concluir que más de 60% de las cuentas permanece sin cobrarse tres meses? 

52 . La política de la Suburban Transit Authority consiste en añadir una ruta de autobús en caso de que 
más de 55% de los pasajeros potenciales indiquen que la utilizarán. Una muestra de 70 pasajeros 
reveló que 42 utilizarían una ruta propuesta que va de Bowman Park al área del centro de la ciu- 
dad. ¿La ruta de Bowman al centro cumple con el criterio de ia STA? Aplique el nivel de significan- 
cia 0.05. 

53 . La experiencia en Crowder Travel Agency indicó que 44% de las personas que le solicitaron pla- 
near sus vacaciones deseaba ir a Europa. Durante la temporada de vacaciones reciente, se eligió 
una muestra aleatoria de 1 000 planes vacacionales archivados. Se descubrió que 480 personas 
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querían ir a Europa de vacaciones. ¿Hubo un incremento significativo en el porcentaje de perso- 
nas que quieren ir a Europa? Lleve a cabo la prueba con un nivel de significancia de 0.05. 

54 . Una investigación en la industria del juego reveló que 10% de las máquinas tragamonedas en 
Estados Unidos deja de funcionar cada año. Short’s Game Arcade tiene 60 de estas máquinas y 
sólo 3 fallaron el año pasado. Utilice el procedimiento de cinco pasos de la prueba de hipótesis 
con un nivel de 0.05 para probar si estos datos contradicen el reporte de la investigación. 

a) Por qué es posible emplear z como el estadístico de prueba? 

b) Establezca las hipótesis nula y alternativa. 

c) Evalúe el estadístico de prueba y tome la decisión. 

d) ¿Cuál es el valor p y qué es lo que implica? 

55 . Un planeador urbano afirma que, en todo el país, 20% de las familias que rentan condominios se 
muda en el lapso de un año. Una muestra de 200 familias que rentan condominios en Dallas 
Metroplex reveló que 56 se mudaron el año pasado. Con un nivel de significancia de 0.01 ¿su- 
gieren estas evidencias que una proporción mayor de propietarios de condominios se mudaron en 
el área de Dallas? Determine el valor p. 

56 . El costo de las bodas en Estados Unidos se disparó en los últimos años. Como resultado, muchas 
parejas optan por casarse en el Caribe. Un centro vacacional caribeño anunció en Bride Magazine 
que el costo de una boda caribeña era inferior a $10 000. En seguida aparece una lista del costo 
total en miles de dólares de una muestra de 8 bodas caribeñas. 


9.7 

9.4 

11.7 

9.0 

9.1 

10.5 

9.1 

9.8 


Con un nivel de significancia de 0.05 ¿Es razonable concluir que el costo medio de una boda es 
inferior a $10 000? 

57 . De acuerdo con una encuesta realizada por ABC News, 40% de los estadounidenses no desayu- 
na. Una muestra de 30 estudiantes universitarios reveló que 16 no lo habían hecho ese día. Utilice 
un nivel de significancia de 0.01 para verificar si ios estudiantes universitarios son más propensos 
a no desayunar. 

58 . Después de perder una temporada, hay un gran clamor para que se despida al director técnico. 
En una muestra aleatoria de 200 alumnos universitarios, 80 están de acuerdo en conservarlo. 
Utilice un nivel de significancia de 0.05 para probar si la proporción de alumnos que apoyan al 
director técnico es menor a 50%. 

59 . En la década de los noventa, el índice de mortalidad por cáncer de pulmón era de 80 por cada 
100 000 personas. A la vuelta del siglo y el establecimiento de nuevos tratamientos y ajustes en la 
publicidad de salud pública, una muestra aleatoria de 10 000 personas exhibe sólo seis muertes 
debidas al cáncer de pulmón. A un nivel de 0.05, pruebe si los datos comprueban una reducción 
del índice de mortalidad de ese tipo de cáncer. 

60 . La American Water Works Association reporta que el uso de agua per cápita en una casa familiar 
es de 69 galones por día. Legacy Rancho es un desarrollo residencial relativamente nuevo de cien 
viviendas. Los constructores instalaron artefactos para utilizarla de forma más eficiente, como 
sanitarios de bajo consumo, y posteriormente condujeron una encuesta de las residencias. 
Respondieron 36 hogares, y la media muestral del consumo de agua por día fue de 64 galones, 
con una desviación estándar de 8.8 galones diarios. A un nivel de significancia de 0.10, ¿se tiene 
suficiente evidencia para concluir que los residentes de Legacy Rancho usan menos agua en pro- 
medio? 

61 . Una máquina expendedora de refresco de cola está programada para despachar 9.00 onzas de 
refresco por vaso, con una desviación estándar de 1 .00 onza. El fabricante de la máquina desea 
establecer el límite de control de manera que para una muestra de 36, 5% de las medias de la 
muestra sea superior al límite de control superior, y 5% de ias medias de las muestras, inferior al 
límite de control inferior. 

a) ¿En qué valor se debe programar el límite de control? 

£>) ¿Cuál es la probabilidad de que si la media de la población cambia a 8.9, el cambio no se 
detecte? 

c) ¿Cuál es la probabilidad de que si la media de la población cambia a 9.3, el cambio no se 
detecte? 

62 . Los propietarios del centro comercial Franklin Park desean estudiar los hábitos de compra de sus 
clientes. De acuerdo con estudios anteriores, los propietarios tienen la impresión de que un com- 
prador común invierte 0.75 horas en el centro comercial, con una desviación estándar de 0.10 
horas. Hace poco, los propietarios del centro comercial incluyeron algunos restaurantes de espe- 
cialidades diseñados para que los clientes pasen más tiempo en él. Se contrató a la empresa de 
consultoría Brunner and Swanson Marketing Enterprises para que evaluara los efectos de los res- 
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taurantes. Una muestra de 45 clientes mostró que el tiempo medio invertido en el centro comer- 
cial se incrementó a 0.80 horas. 

a) Elabore una prueba de hipótesis para determinar si el tiempo medio invertido en el centro 
comercial es superior a 0.75 horas. Utilice un nivel de significancia de 0.05. 

b) Suponga que el tiempo medio de compras realmente aumentó de 0.75 a 0.77 horas. ¿Cuál es 
la probabilidad de que este incremento no se detecte? 

c) Cuando Brunner and Swanson comunicó a los dueños la información del inciso b ), éstos se 
molestaron porque una encuesta no permitió detectar un cambio de 0.75 a 0.77 horas de tiem- 
po de compras. ¿Cómo se puede reducir esta probabilidad? 

63. Se dan las siguientes hipótesis nula y alternativa. 

H 0 : jí, £ 50 
/+i : jjl > 50 

Suponga que la desviación estándar de la población es de 1 0. La probabilidad de cometer un error 
tipo I se establece en 0.01, y la probabilidad de cometer un error tipo II, en 0.30. Suponga que la 
media de la población cambia de 50 a 55. ¿De qué tamaño debe ser una muestra para satisfacer 
estos requisitos? 

64. A partir de su experiencia, una compañía aseguradora calcula que el daño medio de un desastre 
natural en su área asciende a $5 000. Después de presentar varios planes para prevenir pérdidas, 
la empresa toma una muestra aleatoria de 200 asegurados y descubre que la cantidad media por 
reclamo fue de $4 800, con una desviación estándar de $1 300. ¿Resultaron eficaces los planes 
de prevención al reducir la media de los reclamos? Utilice un nivel de significancia de 0.05. 

65. Una revista de abarrotes de circulación nacional informa que el consumidor habitual pasa 8 minu- 
tos en la fila de espera de la caja registradora. Una muestra de 24 clientes de una sucursal de 
Farmer Jack’s reveló una media de 7.5 minutos con una desviación estándar de 3.2 minutos. ¿Es 
menor el tiempo de espera en esta tienda que el reportado por la revista? Utilice un nivel de sig- 
nificancia de 0.05. 


Ejercicios de lo base de datos 

66. Consulte los datos de Real State, con información relativa a las casas vendidas en Goodyear, 

Arizona, el año pasado. 

a) ¿Un artículo reciente en el Arizona Republic indicó que el precio medio de venta de las casas 
en esta área es de más de $220 000. ¿Puede concluir que el precio medio de venta en el área 
de Goodyear, AZ, es superior a $220 000? Utilice un nivel de significancia 0.01 . ¿Cuál es el va- 
lor p? 

ib) El mismo artículo informó que el tamaño medio es de más de 2 100 pies cuadrados. ¿Puede 
concluir que el tamaño medio de las casas que se vendieron en Goodyear, AZ, es de más de 
2 100 pies cuadrados? Utilice un nivel de significancia 0.01. ¿Cuál es el valor p? 

c) Determine la proporción de casas que cuentan con garaje. ¿Se puede concluir con un nivel de 
significancia de 0.05 que más de 60% de las casas que se vendieron en el área de Goodyear, 
AZ, tienen garaje? ¿Cuál es el valor p? 

d) Determine la proporción de casas con alberca. ¿Se puede concluir, con un nivel de significan- 
cia de 0.05, que menos de 60% de las casas que se vendieron en el área de Denver tiene alber- 
ca? ¿Cuál es el valor p? 

67. Consulte los datos de Baseball 2009, con información sobre los 30 equipos de las Ligas Mayores 

de Béisbol en la temporada 2009. 

a) Lleve a cabo una prueba de hipótesis para determinar si el salario medio de los equipos fue dis- 
tinto de $80.0 millones. Aplique un nivel de significancia de 0.05. 

ib) Lleve a cabo una prueba de hipótesis para determinar si la asistencia media fue superior a 
2 000 000 por equipo. 

68. Consulte los datos de los autobuses del Distrito Escolar Buena. 

a) Seleccione la variable del número de millas que recorrieron el mes pasado. Realice una prueba 
de hipótesis para determinar si el número medio de millas recorridas es igual a 840. Utilice un 
nivel de significancia de 0.01. Determine el valor p y explique lo que significa. 

b) Utilizando la variable de costo de mantenimiento, realice una prueba de hipótesis para deter- 
minar si el costo medio de mantenimiento es menor a $500 con un nivel de significancia de 
0-05. Determine el valor p e interprete el resultado. 

c) Suponga que se considera que un autobús es “viejo” si tiene más de ocho años. A un nivel de 
significancia de 0.01, ¿es posible concluir que menos de 40% de los autobuses es viejo? 
Reporte el valor p. 
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Comandos de software 


1. Los comandos de Minitab para el histograma y la estadísti- 
ca descriptiva de la página 349 son los siguientes: 

a) Escriba las 26 observaciones de la muestra en la colum- 
na C1 y nombre Cosí a la variable. 

b) En la barra de menú, seleccione Stat, Basic Statistics y 
Graphical Summary. En el cuadro de diálogo, seleccio- 
ne Cost como variable y haga clic en OK. 



2. Los comandos de Minitab para la prueba t de una muestra 
de la página 353 son los siguientes: 

a) Escriba los datos de la muestra en la columna C1 y 
denomine Length a la variable. 

b) En la barra de menú, seleccione Stat, Basic Statistics, 
1 -Simple t y presione Enter. 

c) Seleccione Length como variable, elija Test mean, 
introduzca el número 43 y haga clic en OK. 



Capítulo 10 


Respuestas a las autoevaluaciones 



10-1 a) H 0 \ |JL = 16.0; p * 16.0 

b) .05 

. X- p 

c) z = r - 

ff/Vñ 

d) Se rechaza H 0 s\z < - 1 .96 o z > 1.96 

, 16.017 - 16.0 0.0170 

S) Z " 0.15/V50 “ 0.0212 “ ' 

f ) No se rechaza H 0 . 

g) No es posible concluir que la cantidad media gastada 
sea distinta a 16 onzas. 


10-2 a) H a \ p < 16.0; H-¡: p > 16.0 
b) Se rechaza H 0 si z > 1 .65 
_ 16.040 - 16.0 _ .0400 
C ' Z ~ 0.15/V50 " .0212 


1.89 


d) Se rechaza H 0 . 

e) La cantidad media gastada es superior a 16.0 onzas. 

f) Valor p = 0.5000 - 0.4706 = 0.0294. El valor p es 
menor que a (0.05), así que se rechaza H 0 Es la 
misma conclusión que en la parte d). 


10-3 a) H 0 \ p < 305; H,: p > 305. 
b) gl = n - 1 =20 — 1 =19 
La regla de decisión consiste en rechazar 
H 0 s\t> 1.729. 



c) f 


X - p 
s/Vñ 


311 - 305 

12/V20 


2.236 


Se rechaza H 0 porque 2.236 > 1 .729. La modificación 
incrementa la vida media de las baterías a más de 305 
días. 
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10-4 a) H 0 : |jl > 9.0; H,: fx < 9.0. 

b) 7, que se calcula mediante n — 1=8-1= 7. 

c) Se rechaza H 0 s\t< -2.998. 



b) H 0 : tt > .40 
Hp tt <.40 

c) Se rechaza H 0 si z < -2.33. 



d) z = -0.87, que se calcula: 


s = 



0.2268 


X = 


70.4 

8 


= 8.8 


De esta manera, 


8.8 - 9.0 
0.2268/V8 


-2.494 


z 


.37 - .40 
.40(1 - .40) 
200 


-.03 

V)00T2 


-0.87 


No se rechaza H 0 . 

e) El valor p es de .1922, que se calcula mediante .5000 
- .3078. 

10-6 0.0054, que se encuentra al determinar el área bajo la 
curva entre 10 078 y 10 180. 


Como -2.494 se encuentra a la derecha de -2.998, 
no se rechaza H 0 . No se demostró que la media es 
menor que 9.0. 

e) El valor p se localiza entre .025 y .010. 

10-5 a) Sí, porque tanto n-ir como n(1 - tt) son mayores a 5: 
htt = 200(.40) = 80, y 
n(1 - tt) = 200(.60) = 120. 


_ X c - n-i 
a/Vñ 

10 078 - 10 180 nrr 
400/VTOO " _2 ' 55 

El área bajo la curva para un valor z de -2.55 es .4946 
(apéndice B.1), y .5000 - .4946 = .0054. 


Pruebas de hipótesis 
de dos muestras 


Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



La familia Damon posee un viñedo grande en el oeste de Nueva York a 
orillas de lago Erie. Las vides deben fumigarse al inicio de la temporada 
de cultivo para protegerlas contra diversos insectos y enfermedades. 
Dos nuevos Insecticidas acaban de salir al mercado: Pernod 5 y Action. 
Para probar su eficacia, se seleccionaron tres hileras y se fumigaron 
con Pernod 5, y otras tres se fumigaron con Action. Cuando las uvas 
maduraron, se revisaron 400 vides tratadas con Pernod 5 para saber si 
no estaban infectadas. De igual forma, se revisó una muestra de 400 
plantas fumigadas con Action. Con un nivel de significancia de 0.05, 

¿se puede concluir que existe una diferencia entre la proporción de 
vides infectadas empleando Pernod 5 en comparación con las 
fumigadas con Action? (Vea el ejercicio 9, objetivo 2.) 


OA1 Realizar la prueba de 
hipótesis de que dos medias 
poblacionales independientes 
con desviaciones estándar 
conocidas son iguales. 

OA2 Efectuar la prueba de la 
hipótesis de que dos 
proporciones de poblaciones 
son iguales. 

OA3 Ejecutar la prueba de 
hipótesis de que dos medias 
poblacionales independientes 
son iguales, bajo el supuesto 
de desviaciones estándares 
poblacionales iguales pero 
desconocidas. 

OA4 Ejecutar una prueba de 
hipótesis de que dos medias 
poblacionales independientes 
son iguales, bajo el supuesto 
de desviaciones estándares 
poblacionales desiguales pero 
desconocidas. 

OA5 Comprender la 
diferencia entre muestras 
dependientes e 
independientes. 

OA6 Efectuar una prueba de 
hipótesis acerca de la 
diferencia media entre 
observaciones apareadas y 
dependientes. 
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CAPÍTULO 11 Pruebas de hipótesis de dos muestras 



Estadística en acción 

La elección presidencial 
de Estados Unidos en 
2000 fue una de las más 
cerradas de la historia. 
Los medios de informa- 
ción fueron incapaces de 
hacer una proyección del 
ganador. La decisión 
final, con recuentos y 
decisiones judiciales, 
tardó más de cinco sema- 
nas. Ésta no fue la única 
elección en la cual hubo 
controversia. Poco antes 
de la elección presiden- 
cial de 1936, el New York 
Times publicó el encabe- 
zado: “La encuesta de 
Digest da a Landon 32 
estados: Landon va 
ganando 4-3.” Sin embar- 
go, Alfred Landon, de 
Kansas, no resultó electo 
presidente. En realidad, 
Roosevelt ganó por más 
de 1 1 millones de votos y 
recibió 523 votos en el 
Colegio Electoral. ¿Por 
qué el encabezado estuvo 
tan errado? 

El Literary Digest 
recopiló una muestra de 
votantes entre las listas 
de números telefónicos, 
registros automovilísticos 
y sus lectores. En 1936 
no muchas personas te- 
nían teléfono o automó- 
vil. Además, quienes 
leían el Digest solían ser 
más ricos y votaban por 
los republicanos. Por 
todo ello, la población de 
la muestra no representa- 
ba a la población de 
votantes. Un segundo 
problema fue la falta de 
respuestas. Se enviaron 
encuestas a más de 10 

(continúa) 


11.1 Introducción 

En el capítulo 10 se inició el estudio de las pruebas de hipótesis. Se describió su naturaleza y 
se realizaron algunas pruebas de hipótesis en las cuales se compararon los resultados de una 
sola muestra con un valor poblacional. Es decir, se seleccionó una sola muestra aleatoria 
de una población y se realizó una prueba para ver si era razonable el valor propuesto de la 
población. Recuerde que en el capítulo 10 se seleccionó una muestra del número de escrito- 
rios ensamblados por semana en la Jamestown Steel Company para determinar si había 
un cambio en la tasa de producción. De modo similar, se muestrearon votantes en un área de 

un estado para determinar si la proporción de la 
población que apoyaría al gobernador para su ree- 
lección era menor que 0.80. En ambos casos, se 
compararon los resultados estadísticos de una 
sola muestra con un parámetro de la población. 

En este capítulo se amplía la ¡dea de pruebas 
de hipótesis para dos muestras. Se seleccionan 
muestras aleatorias de dos poblaciones distintas 
para determinar si son ¡guales las medias o las 
proporciones de la población. Algunas interrogan- 
tes por probar son: 

1 . ¿Hay alguna diferencia entre el valor medio de los bienes raíces residenciales que vendie- 
ron los agentes hombres y los que negociaron las mujeres en el sur de Florida? 

2. ¿Hay alguna diferencia entre los números medios de defectos producidos en los turnos 
matutino y vespertino en Kimble Products? 

3. ¿Hay alguna diferencia entre el número de días de ausentismo de los trabajadores jóve- 
nes (menores de 21 años de edad) y los trabajadores mayores (mayores de 60 años) en la 
industria de comida rápida? 

4. ¿Hay alguna diferencia entre la proporción de estudiantes de maestría de la Ohio State 
Unlverslty y la University of Cincinnatl que aprobaron el examen de certificación de con- 
tador público en el primer Intento? 

5. ¿Hay un aumento de la tasa de producción si se toca música en el área de producción? 

Este capítulo se inicia con el caso en el que se seleccionan muestras aleatorias de dos pobla- 
ciones independientes y se desea investigar si tienen la misma media. 



11.2 Pruebas de hipótesis de dos muestras: 
muestras independientes 

Un especialista en planeación urbana de Florida desea saber si hay alguna diferencia entre los 
salarios medios por hora de los plomeros y los electricistas en el centro de ese estado. Un 
contador financiero quiere saber si la tasa de recuperación media de los fondos mutualistas 
de alto rendimiento es distinta que la tasa de recuperación media de los fondos mutualls- 
tas globales. En cada uno de estos casos hay dos poblaciones independientes. En el prime- 
ro, los plomeros representan una población, y los electricistas, otra. En el segundo caso, los 
fondos mutualistas de alto rendimiento son una población, y los fondos mutualistas globales, 
otra. 

En cada uno de los casos, para despejar la duda, se debería seleccionar una muestra 
aleatoria de cada población y calcular la media de las dos muestras. Si las dos medias pobla- 
cionales son ¡guales, es decir, si el salarlo medio por hora de los plomeros y los electricistas 
es igual, se esperaría que la diferencia entre las dos medias poblacionales fuese de cero. Pero, 
¿qué pasaría si los resultados produjeran una diferencia distinta de cero? ¿La diferencia se 
debe a la casualidad o a que existe una diferencia real entre los salarlos por hora? Una prue- 
ba de las medias de dos muestras ayudará a responder la pregunta. 
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millones de personas y 
cerca de 2.3 millones las 
respondieron. Sin embar- 
go, no se tomó en cuenta 
si las personas que res- 
pondieron formaban una 
muestra representativa de 
los votantes. 

Con las computadoras 
y los métodos modernos 
de encuestas, las muestras 
se seleccionan y verifican 
con cuidado para tener la 
seguridad de que sean 
representativas. ¿Qué 
sucedió con Literary 
Digestí Cerró el negocio 
poco después de la elec- 
ción de 1936. 


OA1 Realizar la prueba de 
hipótesis de que dos medias 
poblacionales independientes 
con desviaciones estándar 
conocidas son iguales. 


Es necesario regresar a los resultados del capítulo 8. Recuerde que se demostró que una 
distribución de las medias suele aproximarse a la distribución normal. Es necesario, una vez 
más, suponer que una distribución de las medias de muestras seguirá una distribución nor- 
mal. Es posible demostrar en forma matemática que la distribución de las diferencias entre 
medias muéstrales de dos distribuciones normales también es normal. 

Esta teoría se ejemplifica en términos del especialista en planeación urbana de Tampa, 
Florida. Para iniciar, dé por cierta información que por lo general no está disponible. Suponga 
que la población de plomeros tiene un salario medio de $30.00 por hora y una desviación 
estándar de $5.00 por hora. La población de electricistas tiene un salario medio de $29.00 y 
una desviación estándar de $4.50. Ahora, a partir de esta información, es claro que las dos 
medias poblacionales no son iguales. Los plomeros ganan $1 .00 por hora más que los elec- 
tricistas. Pero no se puede esperar que se descubra esta diferencia cada vez que tomen 
muestras de las dos poblaciones. 

Suponga que selecciona una muestra aleatoria de 40 plomeros y otra de 35 electricistas, 
y que calcula la media de cada muestra. Después determina la diferencia entre las medias 
muéstrales. Esta diferencia entre las medias muéstrales es la que llama la atención. Si las 
poblaciones tienen la misma media, es de esperar que la diferencia entre las dos medias 
muéstrales sea cero. Si hay alguna diferencia entre las medias poblacionales, debería existir 
una diferencia entre las medias muéstrales. 

Para comprender la teoría, necesita tomar varios pares de muestras, calcular la media de 
cada una, determinar la diferencia entre las medias muéstrales y estudiar la distribución de las 
diferencias entre las medias muéstrales. Del estudio de la distribución de las diferencias entre 
las medias muéstrales del capítulo 8, sabe que la distribución de ellas sigue la distribución nor- 
mal. Si las dos distribuciones de las medias muéstrales siguen la distribución normal, la distri- 
bución de sus diferencias también debe seguir la distribución normal. Éste es el primer obs- 
táculo. 

El segundo se refiere a la media de esta distribución de las diferencias. Si determina que 
la media de esta distribución es cero, esto implica que no hay diferencia entre las dos pobla- 
ciones. Por otro lado, si la media de la distribución de las diferencias es igual a algún valor dis- 
tinto de cero, ya sea positivo o negativo, concluirá que las dos poblaciones no tienen la misma 
media. 

Para reportar algunos resultados concretos, recuerde al especialista en planeación urba- 
na de Tampa, Florida. En la tabla 1 1 -1 aparece el resultado de la selección de 20 muestras di- 
ferentes de 40 plomeros y 35 electricistas, luego de calcular la media de cada muestra y 
determinar la diferencia entre dos medias muéstrales. En el primer caso, la muestra de 40 plo- 
meros tiene una media de $29.80, y la de los electricistas es de $28.76. La diferencia entre las 
medias muéstrales es de $1.04. Este proceso se repitió 19 veces más. Observe que en 17 de 
los 20 casos la media de los plomeros es mayor que la de los electricistas. 

El obstáculo final es que se necesita saber algo acerca de la variabilidad de la distribución 
de las diferencias. En otras palabras, ¿cuál es la desviación estándar de esta distribución de 
las diferencias? En la teoría estadística se demuestra que cuando se tienen poblaciones inde- 
pendientes, como en este caso, la distribución de las diferencias tiene una varianza (desvia- 
ción estándar elevada al cuadrado) Igual a la suma de dos varlanzas individuales. Esto significa 
que se pueden sumar las varianzas de dos distribuciones muéstrales. En otras palabras, la 
varianza de la diferencia entre medias muéstrales (X-i - X 2 ) es Igual a la suma de la varianza 
de los plomeros y de la varianza de los electricistas. 


VARIANZA DE LA DISTRIBUCIÓN DE 
LAS DIFERENCIAS ENTRE MEDIAS 


X, -Xn 


= ^ + 


di-i; 





374 
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TABLA 11-1 Medias de muestras aleatorias de plomeros y electricistas 


Muestra 

Plomeros 

Electricistas 

Diferencia 

1 

$ 29.80 

$ 28.76 

$ 1.04 

2 

30.32 

29.40 

0.92 

3 

30.57 

29.94 

0.63 

4 

30.04 

28.93 

1.11 

5 

30.09 

29.78 

0.31 

6 

30.02 

28.66 

1.36 

7 

29.60 

29.13 

0.47 

8 

29.63 

29.42 

0.21 

9 

30.17 

29.29 

0.88 

10 

30.81 

29.75 

1.06 

11 

30.09 

28.05 

2.04 

12 

29.35 

29.07 

0.28 

13 

29.42 

28.79 

0.63 

14 

29.78 

29.54 

0.24 

15 

29.60 

29.60 

0.00 

16 

30.60 

30.19 

0.41 

17 

30.79 

28.65 

2.14 

18 

29.14 

29.95 

- 0.81 

19 

29.91 

28.75 

1.16 

20 

28.74 

29.21 

- 0.47 


El término cr| x parece complejo, pero no es difícil interpretarlo. La parte a 2 indica que 
es una varianza, y el subíndice, X 1 - X 2 , que es una distribución de las diferencias de las 
medias muéstrales. 

Es posible representar esta ecuación en forma más práctica con la raíz cuadrada, de 
modo que se obtenga la desviación estándar de la distribución o “error estándar” de las dife- 
rencias. Por último, se estandariza la distribución de las diferencias. El resultado es la ecua- 
ción siguiente. 


PRUEBA DE DOS MEDIAS 
DE MUESTRAS a CONOCIDA 


X! -X 2 


/ 2 

_2 

1 

+ CT2 

V 77 -] 

n 2 


( 11 - 2 ) 


y 


Antes de presentar un ejemplo, repase las suposiciones necesarias para emplear la fór- 
mula (11-2). 

• Las dos poblaciones siguen distribuciones normales. 

Las dos muestras no deben estar relacionadas, es decir, deben ser independientes. 

• Debe conocerse la desviación estándar de las dos poblaciones. 

En el ejemplo siguiente se muestran los detalles de la prueba de hipótesis de dos medias 
poblacionales. 


r 

Cjemplo 

Los clientes de los supermercados FoodTown tienen una opción al pagar por sus compras. 
Pueden pagar en una caja registradora normal operada por un cajero, o emplear el nuevo pro- 


cedimiento: Fast Lañe. Cuando eligen la primera alternativa, un empleado registra cada artícu- 
lo, lo pone en una banda transportadora pequeña de donde otro empleado lo toma y lo pone 
en una bolsa, y después en el carrito de víveres. En el procedimiento Fast Lañe, el cliente regis- 
tra cada artículo, lo pone en una bolsa y coloca las bolsas en el carrito. Este procedimiento 
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Solución 


está diseñado para reducir el tiempo que los clientes pierden en la fila de 
la caja. 

El aparato de Fast Lañe se acaba de instalar en la sucursal de la calle 
Byrne de FoodTown. La gerente de la tienda desea saber si el tiempo 
medio de pago con el método tradicional es mayor que con Fast Lañe, para 
lo cual reunió la información siguiente sobre la muestra. El tiempo se mide 
desde el momento en que el cliente ingresa a la fila hasta que sus bolsas 
están en el carrito. De aquí que el tiempo incluye tanto la espera en la fila 
como el registro. ¿Cuál es el valor p? 




Desviación estándar 

Tamaño de 

Tipo de cliente 

Media muestral 

de la población 

la muestra 

Tradicional 

5.50 minutos 

0.40 minutos 

50 

Fast Lañe 

5.30 minutos 

0.30 minutos 

100 


Para responder la pregunta anterior emplee el procedimiento de prueba de hipótesis de cinco 
pasos. 

Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula es que no hay dife- 
rencia entre los tiempos medios de pago de los dos grupos. En otras palabras, la 
diferencia de 0.20 minutos entre el tiempo medio de pago con el método tradicio- 
nal y el tiempo medio de pago con Fast Lañe se debe a la casualidad. La hipóte- 
sis alternativa es que el tiempo medio de quienes utilizan el método tradicional es 
mayor. Si p, s se refiere al tiempo medio de pago de la población de clientes tradi- 
cionales y \Xf al tiempo medio de pago de los clientes que emplean Fast Lañe, las 
hipótesis nula y alternativa son: 

H 0 : < fi f 

H v Fs > Fr 

Paso 2: Seleccione el nivel de significancia. Éste es la probabilidad de que rechace la 
hipótesis nula cuando en realidad es verdadera. Esta posibilidad se determina 
antes de seleccionar la muestra o de realizar algún cálculo. Los niveles de signi- 
ficancia 0.05 y 0.01 son los más comunes, pero también se emplean otros valo- 
res, como 0.02 y 0.10. En teoría, se puede seleccionar cualquier valor entre 0 y 1 
para el nivel de significancia. En este caso se seleccionó el nivel de significancia 
0 . 01 . 

Paso 3: Determine el estadístico de prueba. En el capítulo 10 empleó la distribución 
normal estándar (es decir, z) y f como estadísticos de prueba. En este caso se usa 
la distribución z como el estadístico de prueba debido a que las desviaciones 
estándares de las dos poblaciones se conocen. 

Paso 4: Formule una regla de decisión. Esta regla se basa en las hipótesis nula y alter- 
nativa (es decir, prueba de una o dos colas), en el nivel de significancia y en el 
estadístico de prueba empleado. Seleccionó el nivel de significancia 0.01 y la dis- 
tribución z como el estadístico de prueba, y desea determinar si el tiempo medio 
de pago es mayor con el método tradicional. Se formula la hipótesis alternativa 
que indica que el tiempo medio de pago de quienes emplean el método tradicio- 
nal es mayor. De aquí, la región de rechazo se encuentra en la cola superior de la 
distribución normal (una prueba de una cola). Para determinar el valor crítico, 
coloque 0.01 del área total en la cola superior. Esto significa que 0.4900 (0.5000 
- 0.0100) del área se ubica entre el valor z de 0 y el valor crítico. Después, bus- 
que en el cuerpo del apéndice B.1 un valor ubicado cerca de 0.4900, que es 2.33. 
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Estadística en acción 

¿Vive para trabajar o 
trabaja para vivir? Una 
encuesta reciente entre 
802 trabajadores esta- 
dounidenses reveló que, 
entre quienes conside- 
ran su trabajo como 
una profesión, el núme- 
ro medio de horas que 
trabajan por día es de 
8.7. Entre los que con- 
sideraban su trabajo 
como un empleo, el 
número medio de horas 
trabajadas por día era 
de 7.6. 





Por lo tanto, su regla de decisión es rechazar H 0 si el valor calculado a partir del 
estadístico de prueba es mayor que 2.33. En la gráfica 11-1 aparece la regla de 
decisión. 


H 0 - fts S llf 



GRÁFICA 11-1 


Regla de decisión de una prueba de una cola con un nivel de significancia 0.01 


Paso 5: Tome la decisión respecto de H 0 e interprete el resultado. Emplee la fórmula 
(1 1 -2) para calcular el valor del estadístico de prueba. 


z = 


X s -X, 


12 

_ 2 

/ cr s 

Vf 

s 

+ — 

V n s 

n f 


5.5 - 5.3 



0.30 2 

100 


0.2 

0.064 


3.13 


El valor calculado, 3.13, es mayor que el valor crítico 2.33; en consecuencia, debe 
rechazar la hipótesis nula y aceptar la alternativa. La diferencia de 0.20 minutos 
entre el tiempo medio de pago con el método tradicional es demasiado grande 
para deberse a la casualidad. En otras palabras, la conclusión es que el método 
Fast Lañe es más rápido. 

¿Cuál es el valor p del estadístico de prueba? Recuerde que el valor p es la 
probabilidad de determinar un valor del estadístico de prueba así de excepcional 
cuando la hipótesis nula es verdadera. Para calcular el valor p es necesaria la pro- 
babilidad de un valor z mayor que 3.13. En el apéndice B.1 no aparece la proba- 
bilidad asociada con 3.13. El mayor valor disponible es 3.09. El área que 
corresponde a 3.09 es 0.4990. En este caso, el valor p es menor que 0.001 0, calcu- 
lado mediante 0.5000 - 0.4900. La conclusión es que hay muy pocas probabili- 
dades de que la hipótesis nula sea verdadera. 


En resumen, los criterios para emplear la fórmula (11-2) son: 

1 . Las muestras son de poblaciones independientes. Esto significa, por ejemplo, que el tiem- 
po de pago de los clientes que emplean Fast Lañe no está relacionado con el tiempo de 
pago de los demás clientes. Por ejemplo, el tiempo del señor Smith no afecta ningún otro 
tiempo de pago de otros clientes. 

2. Ambas poblaciones siguen la distribución normal. En el ejemplo FoodTown, esto significa 
que la población de tiempos tanto en la fila estándar como en la de Fast Lañe siguen la 
distribución normal. 

3. Las dos desviaciones estándares de las poblaciones se conocen. En el ejemplo de 
FoodTown, la desviación estándar de la población de los tiempos de pago con Fast Lañe 
fue 0.30 minutos. La desviación estándar de los tiempos de pago tradicionales fue 0.40 
minutos. Emplee la fórmula (11-2) para determinar el valor del estadístico de prueba. 
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Autoevaluación 11-1 Tom Sevits, propietario de Appliance Patch, observó una diferencia en el total en dólares de las 
ventas entre los hombres y las mujeres que emplea como agentes de ventas. Una muestra de 40 
días reveló que los hombres venden una media de $1 400 por concepto de venta de aparatos por 
día. En una muestra de 50 días, las mujeres vendieron una media de $1 500 por concepto de venta 
de aparatos por día. Suponga que la desviación estándar de los hombres es de $200 y la de las 
mujeres de $250. Con un nivel de significancia de 0.05, ¿puede el señor Sevits concluir que la can- 
tidad media que venden por día las mujeres es mayor? 

a) Formule las hipótesis nula y alternativa. 

b ) ¿Cuál es la regla de decisión? 

c) ¿Cuál es el valor del estadístico de prueba? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

e) ¿Cuál es el valor p? 

f) Interprete el resultado. 



comed: 


Ejercicios 

1. Considere una muestra de 40 observaciones de una población con una desviación estándar de la 
población de 5. La media muestral es 102. Otra muestra de 50 observaciones de una segunda po- 
blación tiene una desviación estándar de la población de 6. La media muestral es 99. Realice la 
prueba de hipótesis siguiente con el nivel de significancia de 0.04. 

H a \ = ¡l 2 
H]'- |X-| A |i . 2 

a) ¿Se trata de una prueba de una o de dos colas? 

b) Formule la regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de F/ 0 ? 

e) ¿Cuál es el valor p? 

2. Considere una muestra de 65 observaciones de una población con una desviación estándar de la 
población de 0.75. La media muestral es 2.67. Otra muestra de 50 observaciones de una segun- 
da población tiene una desviación estándar de la población de 0.66. La media muestra! es 2.59. 
Realice la prueba de hipótesis siguiente con el nivel de significancia de 0.08. 

H 0 : p . 1 < p . 2 

H i : Fi > F-2 

a) ¿Se trata de una prueba de una o de dos colas? 

b) Formule la regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de F/ 0 ? 

e) ¿Cuál es el valor p? 

Nota: Para resolver los ejercicios siguientes utilice el procedimiento de prueba de hipótesis de cinco 
pasos. 

3. La compañía Gibbs Baby desea comparar el aumento de peso de bebés que consumen su pro- 
ducto en comparación con el producto de su competidor. Una muestra de 40 bebés que consu- 
men los productos Gibbs reveló un aumento de peso medio de 7.6 libras en sus primeros tres 
meses de vida, con una desviación estándar de la población de la muestra de 2.3 libras. Una 
muestra de 55 bebés que consumen la marca del competidor reveló un aumento medio de 8.1 
libras, con una desviación estándar de la población de 2.9 libras. Con un nivel de significancia de 
0.05, ¿es posible concluir que los bebés que consumieron la marca Gibbs ganaron menos peso? 
Calcule el valor p e interprételo. 

4. Como parte de un estudio de empleados corporativos, el director de recursos humanos de PNC, 
Inc., desea comparar la distancia que deben cubrir para ir al trabajo los empleados de su oficina 
del centro de Cincinnati con la distancia que recorren quienes trabajan en el centro de Pittsburgh. 
Una muestra de 35 empleados de Cincinnati muestra que viajan una media de 370 millas al mes. 
Por su parte, una muestra de 40 empleados de Pittsburgh indica que viajan una media de 380 
millas al mes. La desviación estándar de la población de los empleados de Cincinnati y Pittsburgh 
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OA2 Efectuar la prueba 
de la hipótesis de que dos 
proporciones de poblaciones 
son iguales. 


es de 30 y 26 millas, respectivamente. Con un nivel de significancia de 0.05, ¿existe alguna dife- 
rencia entre el número medio de millas recorrido al mes entre los empleados de Cincinnati y los de 
Pittsburgh? 

5. Se sospecha que la altura de las mujeres es un factor para tener partos difíciles; esto es, una mujer 
más bajita tiene más probabilidades de necesitar una cesárea. Un investigador médico encontró, 
en una muestra de 45 mujeres que habían tenido un parto normal, que su estatura media era de 
61 .4 pulgadas. Una segunda muestra de 39 mujeres que fueron sometidas a cesárea tuvo una 
estatura media de 60.6 pulgadas. Suponga que la población de estaturas relacionadas con los 
partos normales tiene una desviación estándar de 1 .2 pulgadas. También, que las estaturas de la 
población de mujeres que tuvieron partos por cesárea tiene una desviación estándar de 1.1 pul- 
gadas. ¿Eran más bajas las que tuvieron parto por cesárea? Utilice un nivel de significancia de 
0.05. Encuentre el valor p y explique lo que significa. 

6. Mary Jo Fitzpatrick es la vicepresidenta de servicios de enfermería del hospital Luke’s Memorial. 
Hace poco observó que en las ofertas de trabajo para enfermeras sindicalizadas, los sueldos son 
más altos que para las no sindicalizadas. Decidió investigar y reunió la información siguiente. 




Desviación estándar 

Tamaño 

Grupo 

Salario medio 

de la población 

de la muestra 

Sindicalizadas 

$20.75 

$2.25 

40 

No sindicalizadas 

$19.80 

$1 .90 

45 


¿Es razonable concluir que las enfermeras sindicalizadas ganan más? Utilice un nivel de signifi- 
cancia de 0.02. ¿Cuál es el valor p? 

11.3 Prueba de proporciones de dos muestras 

En la sección anterior se consideró una prueba de medias poblacionales. Sin embargo, con 
frecuencia también se tiene Interés en saber si dos proporciones de muestras provienen de 
poblaciones ¡guales. A continuación se presentan algunos ejemplos. 

• El vicepresidente de recursos humanos desea saber si hay alguna diferencia entre la pro- 
porción de empleados asalariados por hora que faltan más de 5 días de trabajo por año 
en las plantas de Atlanta y Houston. 

• General Motors considera un diseño nuevo para el Chevy Malibú. El diseño se muestra a 
un grupo de compradores potenciales menores de 30 años de edad y a otro grupo de 
mayores de 60 años. La compañía quiere saber si hay alguna diferencia entre la propor- 
ción de los dos grupos a quienes les gusta el diseño nuevo. 

• Un asesor de la industria de aerolíneas está investigando el miedo a volar entre los adul- 
tos. En específico, la compañía desea saber si hay alguna diferencia entre la proporción 
de hombres con respecto a mujeres que temen viajar en avión. 

En los casos anteriores, cada elemento o individuo muestreado se clasifica como “éxito” o 
“fracaso”. Es decir, en el ejemplo del Chevy Malibú, cada comprador potencial se clasifica 
como “le gusta el diseño nuevo” o “no le gusta el diseño nuevo”. Después, se compara la pro- 
porción del grupo de menores de 30 años de edad con la proporción del grupo de mayores 
de 60 años que indique el gusto por el diseño nuevo. ¿Las diferencias se deben a la casua- 
lidad? En este estudio no se obtiene ninguna medida, sólo se clasifican los individuos u ob- 
jetos. 

Para realizar la prueba, suponga que la muestra es lo bastante grande para que la distri- 
bución normal sirva como una buena aproximación a la distribución binomial. El estadístico de 
prueba sigue la distribución normal estándar. El valor de z se calcula a partir de la fórmula 
siguiente: 


PRUEBA DE PROPORCIONES 
DE DOS MUESTRAS 


P i ~ P 2 

/ PcO - Pe) Pc O - Pe) 

V n 1 fi- 


el 1-3) 
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Cjemplo 


Solución 


La fórmula (11-3) es la misma que la (11-2) con las proporciones muéstrales respectivas en 
lugar de las medias muéstrales, y con p c (1 - p c ) en lugar de las dos varianzas. Además: 

n - 1 es el número de observaciones en la primera muestra. 
n 2 es el número de observaciones en la segunda muestra. 
p 1 es la proporción en la primera muestra que posee la característica. 
p 2 es la proporción en la segunda muestra que posee la característica. 
p c es la proporción conjunta que posee la característica en las muestras combinadas. Se 
denomina estimación conjunta de la proporción poblacional y se calcula a partir de la 
fórmula siguiente. 

( y y ^ 

PROPORCIÓN CONJUNTA p = 1 + Xg (11-4) 

n, + n 0 

V _ ! J 

Donde: 

X-, es el número que posee la característica en la primera muestra. 

X 2 es el número que posee la característica en la segunda muestra. 

En el ejemplo siguiente se ¡lustra la prueba de proporciones de dos muestras. 



La compañía de perfumes Manelli desarrolló una 
fragancia nueva que planea comercializar con el 
nombre de Heavenly. Varios estudios de mercado 
indican que Heavenly tiene buen potencial de 
mercado. El departamento de ventas de Manelli 
tiene interés en saber si hay alguna diferencia 
entre las proporciones de mujeres jóvenes y 
mayores que comprarían el perfume si saliera al 
mercado. Hay dos poblaciones independientes, 
una de mujeres jóvenes y la otra de mujeres 
mayores. A cada una de las mujeres muestreadas 
se le pedirá que huela el perfume e indique si le 
gusta lo suficiente para comprar un frasco. 


Utilizará el procedimiento usual de prueba de hipótesis de cinco pasos. 

Paso 1: Formule H 0 y H 1 . En este caso, la hipótesis nula es: “No hay diferencia en la pro- 
porción de mujeres jóvenes y mayores que prefieren Heavenly.” Designe a 
como la proporción de mujeres jóvenes que comprarían Heavenly y tt 2 como la 
proporción de mujeres mayores que lo comprarían. La hipótesis alternativa es que 
las dos proporciones no son iguales. 

H 0 : TTl = TT2 

H-i". TT-| ¥= TT 2 

Paso 2: Seleccione el nivel de significancia. En este ejemplo se elige un nivel de signi- 
ficancia de 0.05. 

Paso 3: Determine el estadístico de prueba. El estadístico de prueba sigue la distribu- 
ción normal estándar. El valor del estadístico de prueba se calcula a partir de la 
fórmula (11-3). 

Paso 4: Formule la regla de decisión. Recuerde que la hipótesis alternativa del paso 1 
no indica una dirección, de modo que ésta es una prueba de dos colas. Para 
determinar el valor crítico, divida el nivel de significancia a la mitad y coloque esta 
cantidad en cada cola de la distribución z. Después, reste esta cantidad al área 
total a la derecha de cero, es decir, 0.5000 - 0.0250 = 0.4750. Por último, bus- 
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que en el cuerpo de la tabla z (apéndice B.1) el valor más cercano, que es 1.96. 
Los valores críticos son - 1 .96 y + 1 .96. Como antes, si el valor calculado de z se 
encuentra en la región entre +1.96 y -1.96, no se rechaza la hipótesis nula. En 
tal caso, se supone que cualquier diferencia entre las proporciones de las dos 
muestras se debe a la variación casual. Esta información aparece en la gráfica 
11 - 2 . 



GRÁFICA 11-2 


Reglas de decisión de la prueba de la fragancia Heavenly, nivel de 
significancia 0.05 


Paso 5: Seleccione una muestra y tome una decisión. Una muestra aleatoria de 100 
mujeres jóvenes reveló que a 1 9 les gustó la fragancia Heavenly lo suficiente para 
comprarla. De manera similar, una muestra de 200 mujeres mayores reveló que a 
62 les gustó la fragancia lo suficiente para comprarla. Se designa p-, como el 
número de mujeres jóvenes y p 2 como el de las mujeres mayores. 


P i = 


Xy 
n i 


19 

Too 


= .19 



62 

200 


= .31 


La pregunta de investigación es si la diferencia de 0.12 en las dos proporciones 
de las dos muestras se debe a la casualidad o si hay alguna diferencia entre las 
proporciones de mujeres jóvenes y mayores a quienes les gusta la fragancia 
Heavenly. 

Después, se combinan o se conjuntan las proporciones de las muestras. Se 
emplea la fórmula (1 1 -4). 


X, + X ? 19 + 62 81 

Hc n 1 + n 2 100 + 200 300 

Observe que la proporción conjunta se aproxima más a 0.31 que a 0.19 debido a 
que se muestrearon más mujeres mayores que jóvenes. 

Con la fórmula (11-3) se determina el valor del estadístico de prueba. 


P i -P 2 

/Pc(LiPc) + PcCLiP¡) 

V n 1 n 2 


.19 - .31 

/ .27(1 - .27) .27(1 - .27) 

V 100 + 200 


- 2.21 


El valor calculado de -2.21 se encuentra en el área de rechazo; es decir, está a la izquierda de 
-1.96. Por lo tanto, rechace la hipótesis nula en el nivel de significancia 0.05. En otras pala- 
bras, se rechaza la hipótesis nula de que la proporción de mujeres jóvenes que comprarían la 
fragancia es igual a la proporción de mujeres mayores que también la comprarían. Es improba- 
ble que la diferencia entre las dos proporciones de las muestras se deba a la casualidad. Para 
determinar el valor p, consulte el apéndice B.1 y encuentre la probabilidad de un valor z menor 
que -2.21 o mayor que 2.21. El valor z que corresponde a 2.21 es 0.4864. Por ello, la proba- 
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bilidad de determinar que el valor del estadístico de prueba sea menor que -2.21 o mayor que 
2.21 es: 


Valor p = 2(.5000 - .4864) = 2(.0136) = .0272 

El valor p de 0.0272 es menor que el nivel de significancia 0.05, por lo cual debe rechazar la 
hipótesis nula. Una vez más, la conclusión es que hay una diferencia entre las proporciones de 
mujeres jóvenes y mayores que comprarían la fragancia Heavenly. 

El sistema Minitab tiene un procedimiento para determinar de forma rápida el valor del 
estadístico de prueba y calcular el valor p. Los resultados son los siguientes. 



«JflLÜ 

To*t »nd Cl for Two Proporcione 


sopu X B P 

1 1» 100 0.1*0000 

2 62 200 0.310000 


DKtCMnC* • p (1) - p (2) 

(iumu t»i llllitacti -0.12 

9SS CI (ox utnam (-0.220102. -0.01*09?» 
Tttt toi • 0 (*» not • 0): 2 • -2.21 

r-v»vK >o.o2? 

riso*!-* txoet un: *-v»iu» • 0 . 02 * 

1 

J 

ÜJ 



Observe que en el resultado de Minitab aparecen dos proporciones de las muestras, el valor 
de z y el valor p. 


Autoevaluación 11-2 De 150 adultos que probaron un nuevo pastel sabor durazno, 87 lo calificaron como excelente. De 
200 niños muestreados, 123 lo calificaron como excelente. Con un nivel de significancia de 0.10, 
¿puede concluir que existe una diferencia significativa entre la proporción de adultos y la de niños 
que calificaron al nuevo sabor como excelente? 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la probabilidad de un error tipo I? 

c) ¿Se trata de una prueba de una o dos colas? 

d) ¿Cuál es la regla de decisión? 

e) ¿Cuál es el valor del estadístico de prueba? 

f) ¿Cuál es su decisión respecto de la hipótesis nula? 

g) ¿Cuál es el valor p? Explique qué significa en términos de este problema. 



comed 


Ejercicios 

7. Las hipótesis nula y alternativa son: 

H 0 : ti ’ 1 tt 2 

H{. TT i > T T 2 

Una muestra de 100 observaciones de la primera población indicó que X-, es 70. Una muestra de 
150 observaciones de la segunda población reveló que X 2 es 90. Utilice un nivel de significancia 
de 0.05 para probar la hipótesis. 

a) Formule la regla de decisión. 

b) Calcule la proporción conjunta. 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

8. Las hipótesis nula y alternativa son: 
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Una muestra de 200 observaciones de la primera población indicó que X-, es 170; otra, de 150 
observaciones de la segunda población, reveló que X 2 es 1 1 0. Utilice el nivel de significancia 0.05 
para probar la hipótesis. 

a) Formule la regla de decisión. 

b) Calcule la proporción conjunta. 

c) Estime el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

Nota: Para resolver los ejercicios siguientes utilice el procedimiento de prueba de hipótesis de cinco 
pasos. 

9 . La familia Damon posee un viñedo grande en el oeste de Nueva York a orillas de lago Erie. Los 
viñedos deben fumigarse al inicio de la temporada de cultivo para protegerlos contra diversos 
insectos y enfermedades. Dos nuevos insecticidas acaban de salir al mercado: Pernod 5 y Action. 
Para probar su eficacia, se seleccionaron tres hileras y se fumigaron con Pernod 5, y otras tres se 
fumigaron con Action. Cuando las uvas maduraron, se revisaron 400 vides tratadas con Pernod 5 
para saber si no estaban infectadas. De igual forma, se revisó una muestra de 400 vides fumiga- 
das con Action. Los resultados son: 



Número de 



vides revisadas 

Número de 

Insecticida 

(tamaño de la muestra) 

vides infectadas 

Pernod 5 

400 

24 

Action 

400 

40 


Con un nivel de significancia de 0.05, ¿se puede concluir que existe una diferencia entre la pro- 
porción de vides infectadas empleando Pernod 5 en comparación con las fumigadas con Action? 

10 . GfK Custom Research North America realizó encuestas idénticas en un intervalo de cinco años. 
Una pregunta para las mujeres fue: “¿La mayoría de los hombres son amables, gentiles y consi- 
derados?” La primera encuesta reveló que, de las 3 000 mujeres encuestadas, 2 010 dijeron que 
sí. La última encuesta reveló que 1 530 de las 3 000 mujeres a las cuales se les formuló la pregun- 
ta pensaban que los hombres eran amables, gentiles y considerados. Con un nivel de significan- 
cia de 0.05, ¿se puede concluir que las mujeres consideran que los hombres son menos amables, 
gentiles y considerados en la última encuesta en comparación con la primera? 

11. A una muestra nacional de republicanos y demócratas influyentes se les preguntó, como parte de 
una encuesta muy amplia, si estaban en favor de relajar las normas ambientales para que se pudie- 
ra quemar carbón con alto contenido de azufre en las plantas eléctricas. Los resultados fueron: 



Republicanos 

Demócratas 

Número en la muestra 

1 000 

800 

Número en favor 

200 

168 


Con un nivel de significancia 0.02, ¿puede concluir que hay una proporción mayor de demócratas 
en favor de relajar las normas? Determine el valor p. 

12. El departamento de investigación de la oficina matriz de la New Hampshire Insurance realiza inves- 
tigaciones continuas sobre las causas de accidentes automovilísticos, las características de los 
conductores, etc. Una muestra aleatoria de 400 pólizas de personas solteras reveló que 120 ha- 
bían protagonizado al menos un accidente en el periodo anterior de tres años. De forma similar, 
una muestra de 600 pólizas de personas casadas reveló que 150 habían estado involucradas en 
al menos un accidente. Con un nivel de significancia de 0.05, ¿hay una diferencia significativa entre 
las proporciones de personas solteras y casadas involucradas en un accidente durante un perio- 
do de tres años? Determine el valor p. 

11.4 Comparación de medias poblacionales 
con desviaciones estándares desconocidas 


En las dos secciones anteriores se describieron las condiciones en que la distribución normal 
estándar, es decir, z, se empleó como el estadístico de prueba. En un caso se trabajó con una 
variable (cálculo de la media) y en el segundo con un atributo (cálculo de una proporción). En 
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el primer caso se deseaba comparar dos medias muéstrales de poblaciones Independientes 
para determinar si provenían de las mismas poblaciones o de poblaciones iguales. En ese 
caso se supuso que la población seguía la distribución de probabilidad normal y que se cono- 
cía la desviación estándar de la población. En muchos casos, de hecho en la mayoría, no se 
conoce la desviación estándar de la población. Este problema se soluciona, igual que en el 
caso de una muestra en el capítulo anterior, al sustituir la desviación estándar de la muestra 
(s) por la desviación estándar de la población (<x). Vea la fórmula (10-2) en la página 348. 


Desviaciones estándares poblacionales iguales 

En esta sección se describe otro método para comparar las medias muéstrales de dos pobla- 
ciones Independientes y determinar si las poblaciones muestreadas pueden tener, de forma 
razonable, la misma media. Dicho método no requiere que se conozcan las desviaciones 
estándares de las poblaciones. Esto proporciona más flexibilidad cuando se Investiga la dife- 
rencia entre las medias de las muestras. Hay dos diferencias Importantes entre esta prueba y 
la descrita antes en este capítulo. 


1 . Las poblaciones muestreadas tienen desviaciones estándares ¡guales pero desconocidas. 
Debido a esta suposición, las desviaciones estándares de las muestras se combinan, o 
“agrupan”. 

2. Se utiliza la distribución t como el estadístico de prueba. 


OA3 Ejecutar una prueba de 
hipótesis de que dos medias 
poblacionales independientes 
son iguales, bajo el supuesto 
de desviaciones estándares 
poblacionales iguales pero 
desconocidas. 


La fórmula para determinar el valor del estadístico de prueba t es similar a la fórmula (11-2), 
pero es necesario un cálculo adicional. Las dos desviaciones estándares de las muestras se 
agrupan para formar una sola estimación de la desviación estándar desconocida de la pobla- 
ción. En esencia, se calcula una media ponderada de las dos desviaciones estándares de las 
dos muestras y se emplea este valor como una estimación de la desviación estándar desco- 
nocida de la población. Las ponderaciones son los grados de libertad que proporciona cada 
muestra. ¿Por qué es necesario agrupar las desviaciones estándares de las muestras? Como 
supuso que las dos poblaciones tienen desviaciones estándares ¡guales, la mejor estimación 
posible de ese valor es combinar o agrupar toda la información de las muestras que se tenga 
acerca del valor de la desviación estándar de la población. 

La fórmula siguiente se emplea para agrupar las desviaciones estándares de las muestras. 
Observe que participan dos factores: el número de observaciones en cada muestra y las pro- 
pias desviaciones estándares de las muestras. 


r 


VARIANZA CONJUNTA 


V 


, 2 = (n 1 - 1)s? + (n 2 - 1)sj 
' p n 1 + n 2 - 2 




(11-5) 


V 


donde: 

síj es la varlanza (desviación estándar elevada al cuadrado) de la primera muestra. 
s\ es la varlanza de la segunda muestra. 

El valor de t se calcula a partir de la ecuación siguiente. 


PRUEBAS DE MEDIAS DE DOS 
MUESTRAS tr DESCONOCIDAS 

X! -x 2 

ls 2 p (- + -) 

i 

(11-6) 


V p \n 1 n 2 ) 



donde : 

X., es la media de la primera muestra. 

X 2 es la media de la segunda muestra, 
n-, es el número de observaciones en la primera muestra. 
n 2 es el número de observaciones en la segunda muestra. 
Sp es la estimación conjunta de la varlanza de la población. 
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El número de grados de libertad de la prueba es el número total de elementos muestrea- 
dos menos el número total de muestras. Como hay dos muestras, hay n-¡ + n 2 - 2 grados de 
libertad. 

En resumen, la prueba respeta tres requisitos o suposiciones. 

1. Las poblaciones muestreadas siguen la distribución normal. 

2. Las poblaciones muestreadas son independientes. 

3. Las desviaciones estándares de las dos poblaciones son ¡guales. 

En el ejemplo/solución siguiente se explican los detalles de la prueba. 


Cjemplo 


Solución 


Owens Lawn Care, Inc., fabrica y ensambla podadoras de césped que envía a distribuidores 
instalados en Estados Unidos y Canadá. Se han propuesto dos procedimientos distintos para 
el montaje del motor al chasis de la podadora. La pregunta es: ¿existe una diferencia entre ellos 
con respecto al tiempo medio para montar los motores al chasis de las podadoras? El pri- 
mer procedimiento lo desarrolló Herb Welles, un antiguo empleado de Owens (designado co- 
mo procedimiento 1), y el otro lo desarrolló William Atkins, vicepresidente de ingeniería de 
Owens (designado como procedimiento 2). Para evaluar los dos métodos, se decidió realizar 
un estudio de tiempos y movimientos. Se midió el tiempo de montaje en una muestra de cinco 
empleados según el método de Welles y seis con el método de Atkins. Los resultados, en 
minutos, aparecen a continuación. ¿Hay alguna diferencia entre los tiempos medios de mon- 
taje? Utilice un nivel de significancia de 0.10. 


Welles 

Atkins 

(minutos) 

(minutos) 

2 

3 

4 

7 

9 

5 

3 

8 

2 

4 


3 


Al seguir el procedimiento de los cinco pasos, la hipótesis nula establece que no hay diferen- 
cia entre los tiempos medios de montaje de ambos procedimientos. La hipótesis alternativa 
indica que sí existe una diferencia. 


H n 


M-1 = h-2 


Hy * V 2 


Las suposiciones son: 


Las observaciones incluidas en la muestra de Welles son independientes de las observa- 
ciones de la muestra de Atkins. 

Las dos poblaciones siguen la distribución normal. 

Las dos poblaciones tienen desviaciones estándares iguales. 

¿Hay alguna diferencia entre los tiempos medios de ensamblado con los métodos de Welles y 
Atkins? Los grados de libertad son iguales al número total de elementos muestreados menos 
el número de muestras, en este caso, n 1 + n 2 - 2. Cinco trabajadores utilizaron el método de 
Welles y seis el de Atkins. Por lo tanto, hay 9 grados de libertad, calculados asi: 5 + 6-2. Los 
valores críticos de f, del apéndice B.2 de gl = 9, una prueba de dos colas y el nivel de signifi- 
cancia de 0.10, son -1.833 y 1.833. La regla de decisión se ilustra en la gráfica 11-3. No se 
rechaza la hipótesis nula si el valor calculado de t se encuentra entre —1.833 y 1.833. 
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GRÁFICA 11-3 


Regiones de rechazo, prueba de dos colas, gZ 


9 y nivel de significancia 0.10 


Se emplean tres pasos para calcular el valor de t. 

Paso 1: Calcule las desviaciones estándar de las muestras. Para calcular la desviación 
estándar de la muestra usaremos la fórmula (3-1 1) de la página 84. Vea los deta- 
lles a continuación. 


Método de Welles 

Método de Atkins 

X 

(X -X) 2 

X 2 

(X-X) 2 

2 

II 

1 

c\¡_ 

3 

(3 - 5) 2 = 4 

4 

-p*. 

1 

II 

0 

7 

II 

LO 

1 

9 

(9 - 4) 2 = 25 

5 

O 

II 

LO* 

1 

LO, 

3 

(3 - 4) 2 = 1 

8 

OO 

1 

II 

co 

2 

i 

II 

1 

C\J, 

4 

(4 - 5) 2 = 1 

20 

34 

3 

(3 - 5) 2 = 4 



30 

22 



XX 1 

n i 



y _ SXg 30 


s 


1 


S(X ~ X ,) 2 

n, - 1 



2.9155 s 2 





2.0976 


Paso 2: Agrupe las varianzas de las muestras. Emplee la fórmula (1 1 -5) para agrupar las 
varianzas de las muestras (desviaciones estándares al cuadrado). 

g2 = (n 1 - 1 )sf + (n 2 - 1)s¡ = (5 - 1)(2.91 55) 2 + (6 - 1)(2.0976) 2 = g 2222 
p n 1 +n 2 -2 5 + 6- 2 

Paso 3: Determine el valor de í. El tiempo medio de montaje del método de Welles es de 
4.00 minutos, determinado mediante X 1 = 20/5. El tiempo medio de montaje del 
método de Atkins es de 5.00 minutos, que se determinó mediante X 2 = 30/6. Se 
utiliza la fórmula (1 1 -6) para calcular el valor de t. 


t = 



4.00 - 5.00 



-0.662 


La decisión es no rechazar la hipótesis nula, porque -0.662 se encuentra en la región entre 
-1 .833 y 1 .833. Se concluye que no existe diferencia entre los tiempos medios necesarios para 
montar el motor en el chasis con ambos métodos. 
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Estime también el valor p con el apéndice B.2. Localice la fila con 9 grados de libertad y 
utilice la columna de prueba de dos colas. Encuentre el valor f, sin considerar el signo, el cual 
está más cercano al valor calculado de 0.662. Es 1 .383, que corresponde a un nivel de signi- 
ficancia de 0.20. Así, aunque se hubiera utilizado el nivel de significancia de 20%, no habría 
rechazado la hipótesis nula de medias iguales. El valor p es mayor que 0.20. 


Excel tiene un procedimiento denominado “Prueba t: dos muestras si las varianzas son 
iguales” para realizar los cálculos de las fórmulas (1 1 -5) y (1 1 -6), así como para determinar las 
medias y varianzas de las muestras. Los datos se ingresan en las dos primeras columnas de 
la hoja de cálculo de Excel y se identifican como “Welles” y “Atklns”. A continuación se pre- 
senta la captura de pantalla. El valor de f, denominado “t Stat”, es —0.662, y el valor p de dos 
colas es 0.525. Como sería de esperar, el valorp es mayor que el nivel de significancia de 0.10. 
La conclusión es no rechazar la hipótesis nula. 




nfj Atkins 





A 

8 C 

O 

c 

f 

6 

i 

Welles 

Atkins 

t-Test: Two-Semple Aisuminj £qu*i Venences 



2 

2 

3 





J 

4 

7 


1 i le IWe 
nrwJ 

Attns 


4 

9 

i 

Meen 

4.000 

5.000 


5 

3 

8 

Venence 

8500 

4.400 


6 

2 

4 

Observjrxxn 

5.000 

6 000 


7 


1 

Pooled Venene# 

6.222 



8 



Hypothesued Meen Oifference 

0.000 



9 

<Jf 

9.000 



10 

tStet 

•0.662| 



11 



PfT«t) one-teil 

0.262 



12 



t Cnttcel one-tell 

1833 



13 



P|T<«t) two-tail 

0-3231 



14 

tCriticel two teil 

2.262 



15 








El gerente de producción de Bellevue Steel, fabricante de sillas de ruedas, desea comparar el 
número de sillas de ruedas defectuosas producidas en el turno matutino con el del turno vesperti- 
no. Una muestra de la producción de 6 turnos matutinos y 8 vespertinos reveló el número de defec- 
tos siguiente. 


Matutino 

5 

8 

7 

6 

9 

7 



Vespertino 

8 

10 

7 

11 

9 

12 

14 

9 


Con un nivel de significancia de 0.05, ¿hay alguna diferencia entre el número medio de defectos por 
turno? 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) ¿Cuál es el valor del estadístico de prueba? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

e) ¿Cuál es el valorp? 

f) Interprete el resultado. 

g) ¿Cuáles son las suposiciones necesarias de esta prueba? 


Ejercicios 


comect 


En los ejercicios 13 y 14: a) formule la regla de decisión, b) calcule la estimación conjunta de la varian- 
za de la población, c) calcule el estadístico de prueba, d) tome una decisión respecto de la hipótesis 
nula y e) calcule el valor p. 
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13. Las hipótesis nula y alternativa son: 

H o- M-i = A 2 
H r P'i * P 2 

Una muestra aleatoria de 10 observaciones de una población reveló una media muestral de 23 y 
una desviación estándar de 4. Una muestra aleatoria de 8 observaciones de otra población reve- 
ló una media muestral de 26 y una desviación estándar de la muestra de 5. Con un nivel de signi- 
ficancia de 0.05, ¿hay alguna diferencia entre las medias poblacionales? 

14. Las hipótesis nula y alternativa son: 


H o '■ ^1 = A 2 

Hy n-, # p . 2 

Una muestra aleatoria de 15 observaciones de la primera población reveló una media muestral de 
350 y una desviación estándar de la muestra de 12. Una muestra aleatoria de 17 observaciones 
de la segunda población reveló una media de 342 y una desviación estándar de la muestra de 15. 
Con un nivel de significancia de 0.10, ¿hay alguna diferencia entre las medias poblacionales? 

Nota: En los ejercicios siguientes utilice el procedimiento de prueba de cinco pasos. 

15. A continuación se enlistan los salarios en miles de dólares de los 25 jugadores de la jornada ini- 
cial del equipo de los Yanquis de Nueva York, de las Ligas Mayores de Béisbol. Estos datos apa- 
recen también en el capítulo 4, ejercicio 22. ^ 


Jugador 

Salario ($000) 

Posición 

Aceves, Alfredo 

435.7 

Pitcher 

Burnett, A.J. 

16 500.0 

Pitcher 

Cano, Robinson 

9 000.0 

Segunda base 

Cervelli, Francisco 

410.8 

Catcher 

Chamberlain, Joba 

488.0 

Pitcher 

Gardner, Brett 

452.5 

Jardinero 

Granderson, Curtís 

5 500.0 

Jardinero 

Hughes, Phil 

447.0 

Pitcher 

Jeter, Derek 

22 600.0 

Receptor de pase corto 

Johnson, Nick 

5 500.0 

Primera base 

Marte, Damaso 

4 000.0 

Pitcher 

Mitre, Sergio 

850.0 

Pitcher 

Park, Chan Ho 

1 200.0 

Pitcher 

Pena, Ramiro 

412.1 

Defensa 

Pettitte, Andy 

11 750.0 

Pitcher 

Posada, Jorge 

13 100.0 

Catcher 

Rivera, Mariano 

15 000.0 

Pitcher 

Robertson, David 

426.7 

Pitcher 

Rodríguez, Alex 

33 000.0 

Tercera base 

Sabathia, CC 

24 285.7 

Pitcher 

Swisher, Nick 

6 850.0 

Jardinero 

Teixeira, Mark 

20 625.0 

Primera base 

Thames, Marcus 

900.0 

Jardinero 

Vázquez, Javier 

11 500.0 

Pitcher 

Winn, Randy 

1 100.0 

Jardinero 


Divida a los jugadores en dos grupos: pitchers y no pitchers (jugadores de posición). Asuma que 
existen varianzas poblacionales iguales para ambos. Pruebe la hipótesis de que los salarios 
medios de los pitchers y los jugadores de posición son los mismos comparados con la hipótesis 
alternativa de que no lo son. Utilice un nivel de significancia de 0.01. 

16. En un estudio reciente se comparó el tiempo que pasan juntas las parejas en que sólo trabaja uno 
de los cónyuges con las parejas en que ambos trabajan. De acuerdo con los registros que lleva- 
ron las esposas durante el estudio, ia cantidad media de tiempo que pasan juntos viendo televi- 
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sión las parejas en que sólo trabaja uno de los cónyuges fue 61 minutos por día, con una desvia- 
ción estándar de 15.5 minutos. Las parejas en que los dos trabajan, el número medio de minutos 
que ven televisión fue de 48.4 minutos, con una desviación estándar de 1 8.1 minutos. Con un nivel 
de significancia de 0.01, ¿se puede concluir que, en promedio, las parejas en que sólo trabaja 
uno de los cónyuges pasan más tiempo juntos viendo televisión? En el estudio había 15 parejas 
en que sólo uno trabaja y 12 en que trabajan los dos. 

17. Lisa Monnin es la directora de presupuestos de Nexos Media, Inc. Ella quiere comparar los gas- 
tos diarios en viáticos del personal de ventas con los gastos del personal de auditoría, para lo cual 
recopiló la información siguiente sobre las muestras. m 


Ventas (dólares) 

131 

135 

146 

165 

136 

142 

Auditoría (dólares) 

130 

102 

129 

143 

149 

120 139 


Con un nivel de significancia de 0.10, ¿puede Monnin concluir que los gastos diarios medios del 
personal de ventas son mayores que los del personal de auditoría? ¿Cuál es el valor de p? 

18. La Area Chamber of Commerce de Tampa Bay (Florida) quería saber si el salario semanal medio 
de las enfermeras era mayor que el de los maestros de escuela. Para esta investigación recopiló 
la información siguiente sobre las cantidades que ganó la semana pasada una muestra de maes- 
tros y enfermeras. 


Maestros de escuela (dólares) 

845 

826 827 875 

784 

809 

802 

820 829 830 842 832 

Enfermeras (dólares) 

841 

890 821 771 

850 

859 

825 

829 


¿Es razonable concluir que es mayor el salario semanal medio de las enfermeras? Utilice un nivel 
de significancia de 0.01. ¿Cuál es el valor p? 


Medias poblacionales con desviaciones estándares desiguales 


OA4 Ejecutar la prueba de 
hipótesis de que dos medias 
poblacionales independientes 
son iguales, bajo el supuesto 
de desviaciones estándares 
poblacionales desiguales 
pero desconocidas. 


En las secciones anteriores fue necesario suponer que las poblaciones tenían desviaciones 
estándares iguales. En otras palabras, no se conocían las desviaciones estándares de las 
poblaciones, sino que se suponían iguales. En muchos casos, ésta es una suposición razona- 
ble, pero ¿qué sucede si no son iguales? En el capítulo siguiente se presenta un método for- 
mal para probar esta suposición de varianzas iguales. 

Si no es razonable suponer que las desviaciones estándares poblacionales son iguales, se 
emplea un estadístico muy similar a la fórmula (11-2). Las desviaciones estándares de las 
muestras, s 1 y s 2 , se emplean en lugar de las desviaciones estándares de las poblaciones res- 
pectivas. Además, los grados de libertad se ajustan hacia abajo mediante una fórmula de 
aproximación compleja. El efecto es reducir el número de grados de libertad de la prueba, lo 
cual requerirá un valor mayor del estadístico de prueba para rechazar la hipótesis nula. 

La fórmula del estadístico t es: 


ESTADÍSTICO DE PRUEBA DE MEDIAS 
SIN DIFERENCIA, VARIANZAS DESIGUALES 



(11-7) 

J 


Los grados de libertad estadística se determinan mediante: 


á | 

= [(s 2 //^) + (s|/ r? 2 )] 2 

9 (s 2 /^) 2 (s 2 /n 2 ) 2 ( 11 - 8 ) 

0,-1 n .,-1 

V J ! J 


donde n-, y n 2 son los tamaños muéstrales respectivos, y s-, y s 2 , las desviaciones estándares 
de las muestras respectivas. Si es necesario, esta fracción se redondea hacia abajo a un valor 
entero. En el ejemplo siguiente se ilustran los detalles. 
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Cjemplo 


Solución 


El personal en un laboratorio de pruebas del consumidor evalúa la absorción de toallas de 
papel. Se desea comparar un conjunto de toallas de una marca con un grupo similar de toa- 
llas de otra marca. De cada una de ellas se sumerge una pieza del papel en un tubo con un 
fluido, se deja que el papel escurra en una charola durante dos minutos y después se evalúa 
la cantidad de líquido que el papel absorbió de la charola. Una muestra aleatoria de 9 toallas 
de papel de la primera marca absorbió las cantidades siguientes de líquido en milímetros. 


8 

8 

3 

1 

9 

7 

5 

5 

12 


Una muestra aleatoria independiente de 12 toallas de la otra marca absorbió las cantidades 
siguientes de líquido en milímetros. 


12 

11 

10 

6 

8 

9 

9 

10 

11 

9 

8 

10 


Utilice el nivel de significancia de 0.10 y pruebe si existe una diferencia entre las cantidades 
medias de líquido que absorbieron los dos tipos de toallas. 


Para iniciar se supone que las cantidades de líquido absorbido siguen la distribución de pro- 
babilidad normal de las toallas de la segunda marca como de las de la primera. No se cono- 
cen las desviaciones estándares de las poblaciones, por lo que se empleará la distribución t 
como estadístico de prueba. No parece razonable la suposición de desviaciones estándares de 
las poblaciones iguales. La cantidad de absorción en la primera marca varía de 1 mi a 12 mi. 
En el caso de la segunda, la cantidad de absorción varía de 6 mi a 12 mi. Es decir, existe más 
variación en la cantidad de absorción de la primera marca que de la segunda. Se observa la 
diferencia en la variación en la gráfica de puntos siguiente que se obtuvo con Minitab. Los 
comandos del software para crear una gráfica de puntos en Minitab se dan en la página 135. 


Gráfica de puntos de (Tienda) (Nombre) 


Tiendai 


Nombrei 


ó 8 

Datos 


12 


Por lo tanto, se decide emplear la distribución t y suponer que las desviaciones estándares de 
las poblaciones no son iguales. 

En el procedimiento de prueba de hipótesis de cinco pasos, el primero es formular las 
hipótesis nula y alternativa. La hipótesis nula es que no hay diferencia en la cantidad media de 
líquido que absorben ambos tipos de toallas. La hipótesis alternativa es que sí hay una di- 
ferencia. 

H 0 . t^2 

* P-2 
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El nivel de significancia es 0.10, y el estadístico de prueba sigue la distribución t. Como no se 
desea suponer desviaciones estándares de las poblaciones iguales, se ajustan los grados de 
libertad con la fórmula (11-8). Para hacer ello se necesita determinar las desviaciones estánda- 
res de las muestras. El sistema Minitab es útil para determinar rápidamente estos resultados. 
También se encontrará la tasa de absorción media, la cual se empleará en breve. Los tamaños 
muéstrales respectivos son n 1 = 9 y n 2 = 12, y las desviaciones estándares respectivas, 3.32 
mi y 1 .621 mi. 


Estadísticos descriptivos: Tienda, Nombre 

Variable N Media Desv.est. 
Tienda 9 6.44 3.32 
Nombre 12 9.417 1.621 


Al sustituir esta información en la fórmula (11-8): 

[(s 2 ,/n,) + (s|/n 2 )] 2 [(3.32 2 /9) + (1.621 2 /1 2)] 2 1.4436 2 

9 ~ (sf/n-,) 2 (s|/n 2 ) 2 “ (3.32 2 /9 f (1.621 2 /12 ) 2 " .1875 + .0043 

n 1 - 1 + n 2 - 1 9-1 + 12 - 1 


La práctica común es redondear hacia abajo a un entero, por lo que se emplean 10 grados de 
libertad. Del apéndice B.2 con 1 0 grados de libertad, una prueba de dos colas y un nivel de sig- 
nificancia de 0.10, los valores t críticos son -1 .812 y 1.812. La regla de decisión es rechazar la 
hipótesis nula si el valor calculado de t es menor que -1 .812 o mayor que 1 .812. 

Para determinar el valor del estadístico de prueba se emplea la fórmula (11-7). Recuerde, 
de la salida Minitab anterior, que la cantidad de absorción de las toallas de papel de primera 
marca es 6.44 mi, y 9.417 mi de la otra. 


t = 



6.44 - 9.417 

3^22 TT6212 

+ 

9 12 


-2.478 


El valor calculado de t es menor que el valor crítico menor, por lo que la decisión es rechazar 
la hipótesis nula. Se concluye que la tasa de absorción media de las dos toallas no es la misma. 
La salida de Minitab para este ejemplo es la siguiente. 
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Con frecuencia para las compañías es útil saber quiénes son sus dientes y cómo se convirtieron en 
lo que son. Una compañía de tarjetas de crédito tiene interés en saber si el tarjetahabiente la solici- 
tó por interés propio o si fue contactado por teléfono por un agente. La compañía obtuvo la infor- 
mación muestra] siguiente respecto de los saldos al final del mes de los dos grupos. 


Fuente 

Media 

Desviación estándar 

Tamaño de la muestra 

Solicitantes 

$1 568 

$356 

10 

Contactados 

1 967 

857 

8 


¿Es razonable concluir que el saldo medio de los tarjetahabientes que fueron contactados por telé- 
fono es mayor que el de quienes solicitaron la tarjeta por cuenta propia? Suponga que las desvia- 
ciones estándares de las poblaciones no son iguales. Utilice el nivel de significancia 0.05. 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuántos grados de libertad hay? 

c) ¿Cuál es la regla de decisión? 

d) ¿Cuál es el valor del estadístico de prueba? 

e) ¿Cuál es su decisión respecto de la hipótesis nula? 

f) Interprete el resultado. 


oomect 


Ejercicios 

En los ejercicios 19 y 20 suponga que las poblaciones muéstrales no tienen desviaciones estándares 
iguales y utilice el nivel de significancia 0.05: a) determine el número de grados de libertad, b) formule 
la regla de decisión, c) calcule el valor del estadístico de prueba y d) tome su decisión acerca de la hipó- 
tesis nula. 

19. Las hipótesis nula y alternativa son: 

H 0 : jl 1 = p. 2 

Hy p-, # p 2 

Una muestra aleatoria de 1 5 elementos de la primera población reveló una media de 50 y una des- 
viación estándar de 5. Una muestra de 12 elementos para la segunda población reveló una media 
de 46 y una desviación estándar de 15. 

20. Las hipótesis nula y alternativa son: 

H 0 \ n-! < p, 2 

H{. m-i > F2 

Una muestra aleatoria de 20 elementos de la primera población reveló una media de 100 y una 
desviación estándar de 15. Una muestra de 16 elementos de la segunda población reveló una 
media de 94 y una desviación estándar de 8. Utilice un nivel de significancia de 0.05. 

21. En un artículo reciente en The Wall Street Journal se comparó el costo de adopción de niños de 
China con el de Rusia. En una muestra de 16 adopciones de China, el costo medio fue $1 1 045, 
con una desviación estándar de $835. En una muestra de 18 adopciones de niños de Rusia, el 
costo medio fue $12 840, con una desviación estándar de $1 545. ¿Puede concluir que el costo 
medio de adoptar niños es mayor en Rusia? Suponga que las dos desviaciones estándares pobla- 
cionales no son iguales. Utilice el nivel de significancia de 0.05. 

22. Suponga que usted es un experto en la industria de la moda y desea reunir información para com- 
parar la cantidad mensual que ganan las modelos que vistieron ropa de Liz Claiborne con respec- 
to a las que modelaron ropa de Calvin Klein. La siguiente es la cantidad (en miles de dólares) que 
gana al mes por una muestra de modelos de Liz Claiborne: 


$5.0 

$4.5 

$3.4 

$3.4 

$6.0 $3.3 

$4.5 $4.6 

$3.5 

$5.2 

4.8 

4.4 

4.6 

3.6 

5.0 
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La siguiente es la cantidad (en miles de dólares) que gana una muestra de modelos de Calvin Klein: 


$3.1 $3.7 $3.6 $4.0 $3.8 $3.8 $5.9 $4.9 $3.6 $3.6 

2.3 4.0 


¿Es razonable concluir que las modelos de Claiborne ganan más? Utilice un nivel de significancia 
de 0.05 y suponga que las desviaciones estándares de las poblaciones no son iguales. 


11.5 Pruebas de hipótesis de dos muestras: 
muestras dependientes 

OA5 Comprender la En la página 383 se probó la diferencia entre las medias de dos muestras independientes. Se 

diferencia entre muestras comparó el tiempo medio que se requiere para montar un motor según el método de Welles 

dependientes e con el de Atkins. Las muestras eran independientes, lo que significa que la muestra de los 

independientes. tiempos de ensamblado del método de Welles no estaba de ninguna manera relacionada con 

la muestra de los tiempos que insumía el de Atkins. 

Sin embargo, hay situaciones en que las muestras no son independientes. En otras pala- 
bras, las muestras son dependientes o están relacionadas. Como ejemplo, la compañía Nickel 
Savings and Loan recurre a dos empresas, Schadek Appraisals y Bowyer Real State, para 
valuar los bienes raíces sobre los cuales se hacen los préstamos. Es importante que los ava- 
lúos de estas dos empresas contemplen valores similares. Para revisar la consistencia de las 
dos empresas, Nickel Savings selecciona en forma aleatoria 10 casas y pide a Schadek 
Appraisals y a Bowyer Real State que las valúen. De cada una se harán dos 
avalúos; cada casa tendrá un avalúo de Schadek Appraisals y otro de Bowyer 
Real State. Los avalúos dependen o están relacionados con la casa seleccio- 
nada. A esto también se le conoce como muestra apareada. 

Para la prueba de hipótesis el interés recae en la distribución de las dife- 
rencias entre los valores de avalúo de cada casa. De aquí, sólo hay una mues- 
tra. En palabras más formales, se investiga si la media de la distribución de las 
diferencias entre los avalúos es 0. La muestra se compone de las diferencias 
entre los avalúos determinados por Schadek Appraisals y los de Bowyer Real 
State. Si las dos empresas reportan estimaciones similares, entonces algunas 
veces los avalúos de Schadek serán los de valor mayor y otras veces lo serán 
los de Bowyer Real State. Sin embargo, la media de la distribución de las dife- 
rencias será 0. Por otro lado, si una de las empresas reporta de manera consistente los ava- 
lúos más altos, la media de la distribución de las diferencias no será 0. 

Se empleará el símbolo |j. d para indicar la media poblacional de la distribución de las dife- 
rencias. Se supone que la distribución de las diferencias de la población sigue la distribución 
normal. El estadístico de prueba sigue la distribución t, y su valor se calcula a partir de la 
fórmula siguiente: 


OA6 Efectuar una prueba de 
hipótesis acerca de la 
diferencia media entre 
observaciones apareadas y 
dependientes. 



PRUEBA t APAREADA 

V 


t = 


d 

s d /Vñ 


(11-9) 


V 


Hay n - 1 grados de libertad y 

d es la media de la diferencia entre las observaciones apareadas o relacionadas. 
s d es la desviación estándar de las diferencias entre las observaciones apareadas o rela- 
cionadas. 

n es el número de observaciones apareadas. 
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La desviación estándar de las diferencias se calcula mediante la conocida fórmula de la des- 
viación estándar, excepto que X se sustituye por d. La fórmula es: 


2(cf - d) 2 
n - 1 


En el ejemplo siguiente se ¡lustra esta prueba. 


Cjemplo 


Solución 


Recuerde que Nickel Savings and Loan desea comparar las dos compañías que contrata para 
valuar las casas. Nickel Savings seleccionó una muestra de 10 propiedades y programa los 
avalúos de las dos empresas. Los resultados, en miles de dólares, son: 


Casa 

Schadek 

Bowyer 

1 

235 

228 

2 

210 

205 

3 

231 

219 

4 

242 

240 

5 

205 

198 

6 

230 

223 

7 

231 

227 

8 

210 

215 

9 

225 

222 

10 

249 

245 


Con un nivel de significancia de 0.05, ¿se puede concluir que hay una diferencia entre los ava- 
lúos medios de las casas? 

El primer paso es formular las hipótesis nula y alternativa. En este caso es adecuada una alter- 
nativa de dos colas porque se tiene interés en determinar si hay una diferencia entre los ava- 
lúos. No existe interés en demostrar si una empresa en particular valúa las propiedades con un 
valor mayor que la otra. La pregunta es si las diferencias en la muestra entre los avalúos pue- 
den provenir de una población con una media de 0. Si la media de las diferencias de la pobla- 
ción es 0, se concluye que no hay diferencia entre los avalúos. Las hipótesis nula y alternativa 
son: 

H o '■ Vd = 0 

HylL d ± 0 

Hay 10 casas valuadas por las dos empresas, por lo que n = 10, y g/ = n - 1 =10-1 
= 9. Se tiene una prueba de dos colas, y el nivel de significancia es 0.05. Para determinar el 
valor crítico consulte el apéndice B.2, y vea la fila con 9 grados de libertad hasta la columna de 
una prueba de dos colas y el nivel de significancia 0.05. El valor en la intersección es 2.262. 
Este valor aparece en el cuadro de la tabla 11-2. La regla de decisión es rechazar la hipótesis 
nula si el valor calculado de t es menor que -2.262 o mayor que 2.262. Éstos son los detalles 
del cálculo. 


Casa 

Schadek 

Bowyer 

Diferencia, d 

(d-d) 

(d-d) 2 

1 

235 

228 

1 

2.4 

5.76 

2 

210 

205 

5 

0.4 

0.16 

3 

231 

219 

12 

7.4 

54.76 

4 

242 

240 

2 

- 2.6 

6.76 






(continúa) 
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Casa 

Schadek 

Bowyer 

Diferencia, d 

(d-d) 

(d-d) 2 

5 

205 

198 

7 

2.4 

5.76 

6 

230 

223 

7 

2.4 

5.76 

7 

231 

227 

4 

-0.6 

0.36 

8 

210 

215 

-5 

-9.6 

92.16 

9 

225 

222 

3 

-1.6 

2.56 

10 

249 

245 

4 

-0.6 

0.36 




46 

0 

174.40 



I c- 

H c 

II 

IT3 

46 

= io = 460 





/Z(d - d) 2 

/ 174.4 

= 4.402 



s d 1 

V n - 1 

V io - i 



Con la fórmula (11-9), el valor del estadístico de prueba es 3.305, determinado por 


d 4.6 _ 4.6 

s d /Vñ ~ 4.402/ \^Í0 ~~ 1.3920 


3.305 



Como el valor calculado de t se encuentra en la región de rechazo, se rechaza la hipótesis nula. 
La distribución de las diferencias de la población no tiene una media de 0. Se concluye que hay 
una diferencia entre los avalúos medios de las casas. La diferencia mayor de $12 000 es en la 
casa 3. Quizás éste sería un buen lugar para iniciar una revisión más detallada. 

Para determinar el valor p, consulte el apéndice B.2 y la sección de una prueba de dos 
colas. Busque en la fila con 9 grados de libertad y encuentre los valores de t que se aproximen 
al valor calculado. Para un nivel de significancia de 0.01, el valor de t es 3.250. El valor calcu- 
lado es mayor, pero menor que el valor de 4.781 que corresponde al nivel de significancia de 
0.001 . De aquí, el valor p es menor que 0.01 . Esta información se resalta en la tabla 1 1 -2. 


TABLA 11-2 Parte de la distribución t del apéndice B.2 


Intervalos de confianza 


80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia de una prueba de una cola 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia de una prueba de dos colas 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

636.619 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

31.599 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

12.924 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

8.610 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

6.869 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

5.959 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

5.408 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

5.041 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.781 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.587 
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Excel tiene un procedimiento denominado “Prueba t: Dos muestras apareadas para 
medias” que realiza los cálculos de la fórmula (11-9). La captura de pantalla de este procedi- 
miento aparece a continuación. 

El valor calculado de t es 3.305, y el valor p de dos colas, 0.009. Como el valor p es menor 
que 0.05, se rechaza la hipótesis de que la media de la distribución de las diferencias entre los 
avalúos es cero. De hecho, este valor p se encuentra entre 0.01 y 0.001. Hay una pequeña 
posibilidad de que la hipótesis nula sea verdadera. 


«¡1 



A 

B 

C 

1 

Mom* 

SctiAdck 

Bowy« 

2 

1 

235 

228 

3 

2 

210 

205 

4 

3 

231 

219 

5 

4 

242 

240 

• 

5 

205 

198 

7j 

6 

230 

223 

8 

7 

231 

227 

9 

S 

210 

215 

10 

9 

225 

222 

u 

10 

249 

245 


12 

13 

14 

15 


E F 

P»r*d Two S«mpl« for M*mt 


Scfoxfr» 

M««n 226.800 

Varunc* 2C8. 844 

Obí«fviTions 10.000 

Peinon CorrcUtion 0.953 

HypothesizeO Mean Dtfference 0.000 

df 9.000 



one-tail 0.005 

t Critical one-Uil 1.833 



t Crttical two-Uil 2.262 


G 


Bowytr 

222.200 

204.178 

10.000 


11.6 Comparación de muestras 

dependientes e independientes 

Con frecuencia, los estudiantes principiantes confunden la diferencia entre las pruebas de 
muestras independientes [fórmula (11-6)] con las pruebas de muestras dependientes [fórmula 
(11-9)]. ¿Cómo distinguir la diferencia entre muestras dependientes e independientes? Hay 
dos tipos de muestras dependientes: 1) las que se caracterizan por una medición, una inter- 
vención de algún tipo y después otra medición, y 2) una relación o agrupación de las obser- 
vaciones. Para explicarlo con más detalle: 

1. El primer tipo de muestra dependiente se caracteriza por una medición seguida de una 
intervención de alguna clase y después otra medición. Esto se puede denominar un estu- 
dio de “antes” y “después”. Dos ejemplos ayudarán a explicarlo mejor. Suponga que 
desea demostrar que, al colocar bocinas en el área de producción y tocar música relajan- 
te, aumenta la producción. Comienza con la selección de una muestra de trabajadores y 
una medición de sus resultados en las condiciones actuales. Después instala las bocinas 
en el área de producción y vuelve a medir la producción de los mismos trabajadores. Hay 
dos mediciones: antes de colocar las bocinas en el área de producción y después. La 
intervención es la colocación de las bocinas en el área de producción. 

Un segundo ejemplo comprende una empresa educativa que ofrece cursos diseñados 
para incrementar las calificaciones en los exámenes y la capacidad para leer (SAT). 
Suponga que la empresa quiere ofrecer un curso que ayudará a los alumnos de primer año 
de preparatoria a aumentar sus puntajes en el SAT. Para iniciar, cada estudiante presenta 
el SAT en el primer año de preparatoria. Durante el verano, entre los años primero y últi- 
mo, participan en el curso que les proporciona consejos para presentar exámenes. Para 
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finalizar, durante el otoño del último año de preparatoria, vuelven a presentar el SAT. Una 
vez más, el procedimiento se caracteriza por una medición (presentar el SAT como estu- 
diante de primer año), una intervención (los talleres de verano) y otra medición (presentar 
el SAT durante su último año). 

2. El segundo tipo de muestra dependiente se caracteriza por relacionar o aparear observa- 
ciones. En el ejemplo anterior, Nickel Savings es una muestra dependiente de este tipo. 
Se seleccionó una propiedad para su valuación y después obtuvo dos valuaciones sobre 
ella. Como segundo ejemplo, suponga que una psicóloga industrial desea estudiar las 
similitudes intelectuales de parejas recién casadas, para lo cual selecciona una muestra 
de recién casados. Después, administra una prueba de inteligencia estándar tanto al hom- 
bre como a la mujer para determinar la diferencia entre las calificaciones. Observe la rela- 
ción que ocurrió: se comparan las calificaciones apareadas o relacionadas por un ma- 
trimonio. 

¿Por qué se prefieren las muestras dependientes a las independientes? Cuando se emplean 
muestras dependientes, se reduce la variación en la distribución del muestreo. Para ilustrar 
este ejemplo se utilizará el caso de Nickel Savings and Loan. Suponga que se tienen dos 
muestras independientes de propiedades de bienes raíces para su avalúo y se realiza la prue- 
ba de hipótesis siguiente, con la fórmula (11-6). Las hipótesis nula y alternativa son: 

H 0 . P-| P2 

Hy |Xl * M-2 

Ahora hay dos muestras independientes de 10 cada una. Así, el número de grados de libertad 
es 10 + 10 - 2 = 18. Del apéndice B.2, en el nivel de significancia de 0.05, H 0 se rechaza si 
t es menor que —2.101 o mayor que 2.101. 

Se emplean los mismos comandos de Excel que en la página 100 del capítulo 3 para 
determinar la media y la desviación estándar de las dos muestras independientes, y los 
comandos de Excel de la página 408 de este capítulo para encontrar la varianza agrupada y 
el valor de “t Stat”. Estos valores están resaltados con color amarillo. 


Independen t t test 



I f 

Two-Stntpl* Asiumtnf Eou*l V«ri*nc*s 


irtlorirt 

M**n 226.800 

VKiínc* 201.144 

Ob*erv*tions 10.000 

Pool*d Vtrtinc* 206 511 
Mypoth*su*<j Mean Otfftrenca 0.000 

df 18.000 



O M 



La media del avalúo de las 10 propiedades de Schadek es de $226 800, y la desviación 
estándar, $14 500. La media de los avalúos de Bowyer Real State es de $222 200, y la des- 
viación estándar, $14 290. Para facilitar los cálculos, se emplean miles de dólares en lugar de 
dólares. El valor de la estimación agrupada de la varianza a partir de la fórmula (1 1 -5) es 

2 _ (n 1 - 1)sf + (n 2 - 1)s| _ (10 - 1)(14.45 2 ) + (10 - 1)(14.29) 2 
Sp n-¡ + n 2 - 2 


10 + 10-2 


= 206.50 
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De la fórmula (1 1 -6), t es 0.71 6. 


t = 



226.8 - 222.2 
V 206 - 5o (íí + 


4.6 

6.4265 


0.716 


El valor calculado de t (0.716) es menor que 2.101, de manera que la hipótesis nula no se 
rechaza. No es posible demostrar que hay una diferencia entre los avalúos medios. ¡Ésta no 
es la misma conclusión a la que se llegó antes! ¿Por qué? El numerador es el mismo que en 
la prueba de observaciones apareadas (4.6). Sin embargo, el denominador es menor. En la 
prueba por pares el denominador es 1.3920 (vea los cálculos en la página 394). En el caso de 
las muestras independientes, el denominador es 6.4265. La variación o incertidumbre son 
mayores. Esto explica la diferencia entre los valores t y la diferencia entre las decisiones esta- 
dísticas. El denominador mide el error estándar de la estadística. Cuando las muestras no se 
aparean, se presentan dos clases de variación: diferencias entre las dos empresas valuadoras 
y la diferencia en el valor del bien raíz. Las propiedades 4 y 10 tienen valores comparativamen- 
te altos, en tanto que el del número 5 es relativamente bajo. Estos datos muestran lo diferen- 
tes que son los avalúos de las propiedades, pero lo que Interesa en realidad es la diferencia 
entre las dos empresas valuadoras. 

La estrategia es aparear los valores para reducir la variación entre las propiedades. En la 
prueba apareada sólo se emplea la diferencia entre las dos empresas valuadoras para 
la misma propiedad. Así, la estadística apareada o dependiente se enfoca sobre la variación 
entre Schadek Appraisals y Bowyer Real State. Por lo tanto, su error estándar siempre es 
menor. Esto, a su vez, conduce a una estadística de prueba mayor y a una probabilidad mayor 
de rechazar la hipótesis nula. Por lo tanto, siempre que sea posible se deben aparear los 
datos. 

Aquí hay una mala noticia. En la prueba de observaciones apareadas, los grados de liber- 
tad son la mitad de lo que serían si no se apareasen las muestras. En el ejemplo de bienes raí- 
ces, los grados de libertad disminuyen de 18 a 9 cuando las observaciones están apareadas. 
Sin embargo, en la mayoría de los casos, éste es un precio pequeño que se debe pagar por 
una prueba mejor. 


r 


Autoevaluación 


11-5 


La publicidad que realiza Sylph Fitness Center afirma que, al terminar su entrenamiento, las per- 
sonas bajarán de peso. Una muestra aleatoria de ocho participantes recientes reveló los pesos 
siguientes antes y después de terminar el entrenamiento. Con un nivel de significancia de 0.01, 
¿se puede concluir que los participantes bajan de peso? 


A 


Nombre 

Antes 

Después 

Hunter 

155 

154 

Cashman 

228 

207 

Mervine 

141 

147 

Massa 

162 

157 

Creóla 

211 

196 

Peterson 

164 

150 

Redding 

184 

170 

Poust 

172 

165 



a) Formule las hipótesis nula y alternativa. 
tí) ¿Cuál es el valor crítico de f? 

c) ¿Cuál es el valor calculado de f? 

d) Interprete el resultado. ¿Cuál es el valor p? 

e) ¿Qué suposición necesita acerca de la distribución de las diferencias? 
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comed: 


Ejercicios 

23. Las hipótesis nula y alternativa son: 


H o- ^d ~ 0 

Hy Jly > 0 

En la información muestral siguiente aparece el número de unidades defectuosas que producen 
los turnos matutino y vespertino en una muestra de cuatro días durante el mes pasado. 





Dia 



1 

2 

3 

4 

Turno matutino 

10 

12 

15 

19 

Turno vespertino 

8 

9 

12 

15 


Con un nivel de significancia de 0.05, ¿se puede concluir que se producen más defectos en el 
turno vespertino? 

24. Las hipótesis nula y alternativa son: 


H o- P-d = 0 
Hy * 0 

Las observaciones apareadas siguientes muestran el número de multas de tránsito por conducir a 
exceso de velocidad de los oficiales Dhondt y Meredith, de la South Carolina Highway Patrol, 
durante los últimos cinco meses. 





Día 




Mayo 

Junio 

Julio 

Agosto 

Septiembre 

Oficial Dhondt 

30 

22 

25 

19 

26 

Oficial Meredith 

26 

19 

20 

15 

19 


Con un nivel de significancia de 0.05, ¿hay alguna diferencia entre los números medios de multas 
que dieron los dos oficiales? 

Nota: Para resolver los ejercicios siguientes utilice el procedimiento de prueba de hipótesis de cinco 
pasos. 

25. La gerencia de Discount Furniture, cadena de mueblerías de descuento del noreste de Estados 
Unidos, diseñó un plan de incentivos para sus agentes de ventas. Para evaluar este plan innova- 
dor, se seleccionaron a 12 vendedores al azar, y se registraron sus ingresos anteriores y posterio- 
res al plan. 


Vendedor 

Antes 

Después 

Sid Mahone 

$320 

$340 

Carol Quick 

290 

285 

Tom Jackson 

421 

475 

Andy Jones 

510 

510 

Jean Sloan 

210 

210 

Jack Walker 

402 

500 

Peg Mancuso 

625 

631 

Anita Loma 

560 

560 

John Cuso 

360 

365 

Cari Utz 

431 

431 

A. S. Kushner 

506 

525 

Fern Lawton 

505 

619 


¿Hubo algún aumento significativo en el ingreso semanal de un vendedor debido al innovador plan 
de incentivos? Utilice el nivel de significancia 0.05. Calcule el valor p e interprételo. 


Resumen del capítulo 
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26. Hace poco, el gobierno federal estadounidense otorgó fondos para un programa especial diseña- 
do para reducir los delitos en áreas de alto riesgo. Un estudio de los resultados del programa en 
ocho áreas de alto riesgo de Miaml, Florida, produjo los resultados siguientes. 




Número de delitos por área 




A B 

C 

D 

E 

F 

G 

H 

Antes 

14 7 

4 

5 

17 

12 

8 

9 

Después 

2 7 

3 

6 

8 

13 

3 

5 


¿Hubo alguna disminución en el número de delitos desde la inauguración del programa? Utilice el 
nivel de significancia 0.01 . Calcule el valor p. 


Resumen del capítulo 

I. Al comparar dos medias poblacionales se desea saber si pueden ser iguales. 

A. Se investiga si la distribución de la diferencia entre las medias puede tener una media de 0. 

B. El estadístico de prueba sigue la distribución normal estándar si se conocen las desviaciones 
estándares de las poblaciones. 

1. No se requiere de ninguna suposición acerca de la forma de las poblaciones. 

2. Las muestras son de poblaciones independientes. 

3. La fórmula para calcular el valor z es 


z = 


X, -X 2 



( 11 - 2 ) 


II. También se puede comprobar si dos muestras provienen de poblaciones con la misma proporción 
de éxitos. 

A. Las dos proporciones muéstrales se agrupan con la fórmula siguiente: 


Pe 


X, + X 2 
n, +n 2 


B. Se calcula el valor del estadístico de prueba a partir de la fórmula siguiente: 


(11-4) 


P i Pz 

/ p c (1 - P e) + Pc( 1 - Pe) 

V n, n 2 


(11-3) 


III. El estadístico de prueba para comparar dos medias es la distribución t, si no se conocen las des- 
viaciones estándares poblacionales. 

A. Las dos poblaciones deben seguir la distribución normal. 

B. Las poblaciones deben tener desviaciones estándares iguales. 

C. Las muestras son independientes. 

D. La determinación del valor de t requiere dos pasos. 

1. El primer paso es agrupar las desviaciones estándares de acuerdo con la fórmula siguiente: 


= (n i - 1)s^ + (n 2 - 1)sj 
p n 1 + n 2 - 2 

2. El valor de t se calcula a partir de la fórmula siguiente: 



(11-5) 


( 11 - 6 ) 


3. Los grados de libertad de la prueba son n 1 + n 2 - 2. 
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IV. Si no es posible suponer que las desviaciones estándares de la población son iguales, 

A. Utilice ia distribución t como el estadístico de prueba, pero ajuste los grados de libertad median- 
te la fórmula siguiente: 


. [(sfM) + (s| /n 2 )] 2 

(Si /nQ 2 + ( s ¡ / n 2 ) 2 

r?i - 1 n 2 - 1 

B. El valor del estadístico de prueba se calcula a partir de la fórmula siguiente: 


Xi - X 2 



( 11 - 8 ) 


(11-7) 


V. Para muestras dependientes, se supone que la distribución de las diferencias apareadas entre las 
poblaciones tiene una media de 0. 

A. Primero se calcula la media y la desviación estándar de las diferencias muéstrales. 

B. El valor del estadístico de prueba se calcula a partir de la fórmula siguiente: 


t = 


d 

s d /Vñ 


(11-9) 


Clave de pronunciación 

SÍMBOLO SIGNIFICADO 


Pe 

*1 

X 2 

d 


s d 


Proporción conjunta 
Varianza conjunta de la muestra 
Media de la primera muestra 
Media de la segunda muestra 
Media de la diferencia entre 
observaciones dependientes 

Desviación estándar de la diferencia 
entre observaciones dependientes 


PRONUNCIACIÓN 

p subíndice c 
s subíndice p al cuadrado 
X barra subíndice 1 
X barra subíndice 2 
d barra 

s subíndice d 


comed; 
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27. Un estudio reciente se enfocó en el número de veces que los hombres y las mujeres que viven 
solos compran comida para llevar en un mes. La información se resume a continuación. 


Estadístico 

Hombres 

Mujeres 

Media de la muestra 

24.51 

22.69 

Desviación estándar de la población 

4.48 

3.86 

Tamaño de la muestra 

35 

40 


Con un nivel de significancia de 0.01 , ¿hay alguna diferencia entre el número medio de veces que 
los hombres y las mujeres piden comida para llevar en un mes? ¿Cuál es el valor p? 

28. Clark Heter es un ingeniero industrial en Lyons Products, y le gustaría determinar si se producen 
más unidades en el turno nocturno que en el matutino. Suponga que la desviación estándar de la 
población del número de unidades producidas en el turno matutino es 21 y 28 en el nocturno. Una 
muestra de 54 trabajadores del turno matutino reveló que el número medio de unidades produci- 
das fue 345. Una muestra de 60 trabajadores del turno nocturno reveló que el número medio de 
unidades producidas fue 351. Con un nivel de significación de 0.05, ¿es mayor el número de uni- 
dades producidas en el turno nocturno? 

29. Fry Brothers Heating and Air Conditioning, Inc., emplea a Larry Clark y George Murnen para ofre- 
cer por teléfono servicios de reparación de chimeneas y unidades de aire acondicionado en casas. 
Al propietario, Tom Fry, le gustaría saber si hay alguna diferencia entre los números medios de lia- 
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madas diarias. Suponga que la desviación estándar de la población de Larry Clark es 1 .05 llama- 
das por día, y de 1 .23 la de George Murnen. Una muestra aleatoria de 40 días que se realizó el año 
pasado reveló que Larry Clark hace un promedio de 4.77 llamadas por día. En una muestra de 50 
días, George Murnen realizó un promedio de 5.02 llamadas por día. Con un nivel de significancia 
de 0.05, ¿hay alguna diferencia entre los números medios de llamadas por día de los dos emplea- 
dos? ¿Cuál es el valor p? 

30 . Un fabricante de café está interesado en saber si el consumo diario medio de bebedores de café 
regular es menor que el de bebedores de café descafeinado. Suponga que la desviación estándar 
de la población de los bebedores de café regular es 1 .20 tazas por día, y 1 .36 tazas por día en el 
caso de los bebedores de café descafeinado. Una muestra aleatoria de 50 bebedores de café 
regular reveló una media de 4.35 tazas por día. Una muestra de 40 bebedores de café descafei- 
nado reveló una media de 5.84 tazas por día. Utilice el nivel de significancia de 0.01. Calcule el 
valor p. 

31 . Una compañía de teléfonos celulares ofrece dos planes a sus suscriptores. En el momento en que 
los suscriptores firman el contrato se les pide que proporcionen alguna información demográfica. 
El ingreso anual medio de una muestra de 40 suscriptores al Plan A es $57 000, con una desvia- 
ción estándar de $9 200. Esta distribución tiene una asimetría positiva; el coeficiente de asimetría 
real es 2.1 1 . En una muestra de 30 suscriptores al Plan B, el ingreso medio es de $61 000, con una 
desviación estándar de $7 100. La distribución de los suscriptores al Pian B también tiene una asi- 
metría positiva, pero no tan marcada. El coeficiente de asimetría es 1 .54. Con un nivel de signifi- 
cancia de 0.05, ¿es razonable concluir que el ingreso medio de los que eligen el Plan B es mayor? 
¿Cuál es el valor p? ¿Afectan los coeficientes de asimetría los resultados de la prueba de hipóte- 
sis? ¿Por qué? 

32 . Un fabricante de computadoras ofrece una línea de ayuda para sus compradores, quienes pueden 
llamar las 24 horas de los 7 días de la semana. Responder a estas llamadas de ayuda en forma 
oportuna es importante para la imagen de la compañía. Después de decirle al cliente que la solu- 
ción del problema es importante, se le pregunta si el problema se relaciona con el software o con 
el hardware. El tiempo medio que emplea un técnico en resolver un problema de software es 18 
minutos, con una desviación estándar de 4.2 minutos. Esta información se obtuvo de una mues- 
tra de 35 llamadas supervisadas. En un estudio de 45 problemas de hardware, el tiempo medio 
que emplea el técnico para resolver el problema fue de 15.5 minutos, con una desviación están- 
dar de 3.9 minutos. Esta información también se obtuvo de llamadas supervisadas. Con un nivel 
de significancia de 0.05, ¿es más lento resolver problemas de software? ¿Cuál es el valor p? 

33 . Suponga que ei fabricante de Advil, analgésico común para el dolor de cabeza, hace poco des- 
arrolló una fórmula nueva del medicamento que afirma ser más eficaz. Para evaluar el nuevo medi- 
camento, se pidió que lo probara una muestra de 200 usuarios. Después de una prueba de un 
mes, 180 indicaron que el medicamento nuevo era más eficaz. Al mismo tiempo, a una muestra de 
300 usuarios de Advil se les da el medicamento actual, pero se les dice que tiene la fórmula nueva. 
De este grupo, 261 dijo que había mejorado. Con un nivel de significancia de 0.05, ¿se puede con- 
cluir que el medicamento nuevo es más eficaz? 

34 . Cada mes, la National Association of Purchasing Managers publica el índice NAPM. Una de las 
preguntas que se plantea en la encuesta a los agentes de compras es: ¿Considera que la econo- 
mía está en expansión? El mes pasado, de las 300 respuestas, 160 fueron afirmativas. Este mes, 
170 de las 290 respuestas indicaron que la economía estaba en expansión. Con un nivel de signi- 
ficancia de 0.05, ¿se puede concluir que una proporción mayor de los agentes considera que la 
economía está en expansión este mes? 

35 . Como parte de una encuesta reciente entre parejas en que los dos cónyuges trabajan, un psicó- 
logo industrial determinó que 990 hombres de 1 500 encuestados creen que es justa la división de 
tareas domésticas. Una muestra de 1 600 mujeres reveló que 970 creen que la división es justa. 
Con un nivel de significancia de 0.01, ¿es razonable concluir que es más alta la proporción de 
hombres que creen que es justa la división de tareas domésticas? ¿Cuál es el valor p? 

36 . En el área de Colorado Springs, Colorado, hay dos proveedores de internet: HTC y Mountain 
Communications. Se desea investigar si hay alguna diferencia en la proporción de veces que un 
cliente puede conectarse a internet. Durante un periodo de una semana, se hicieron 500 llamadas 
a HTC en diversas horas del día y la noche. Se logró una conexión a internet en 450 ocasiones. 
Un estudio similar durante una semana con Mountain Communications reveló que la conexión se 
logró en 352 de 400 intentos. Con un nivel de significancia de 0.01, ¿hay alguna diferencia en el 
porcentaje de veces que se logró la conexión a internet? 

37 . La Consumer Confidence Survey es una revisión mensual que mide la confianza del consumidor 
en la economía estadounidense. Se basa en una muestra típica de 5 000 hogares. El mes pasado, 
9.1 % de los consumidores dijo que las condiciones eran “buenas”. El mes anterior, sólo 8.1 % sos- 
tuvo que eran “buenas”. Utilice el método de prueba de hipótesis de cinco pasos a un nivel de sig- 
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nificancia de 0.05 para ver si puede determinar que hubo un incremento de la proporción que con- 
sideraba las condiciones como “buenas”. Encuentre el valor p y explique lo que significa. 

38 . Se realizó un estudio para determinar si había una diferencia entre el contenido humorístico de los 
anuncios en revistas inglesas y estadounidenses. En una muestra aleatoria independiente de 
270 anuncios en revistas estadounidenses, 56 tenían contenido humorístico. Una muestra aleato- 
ria independiente de 203 revistas inglesas encontró 52 anuncios humorísticos. ¿Estos datos pro- 
porcionan evidencia, con un nivel de significancia de 0.05, de que hay una diferencia entre las 
proporciones de anuncios humorísticos en las revistas inglesas en comparación con las estado- 
unidenses? 

39 . La encuesta de AP-Petside.com contactó a 300 mujeres casadas y a 200 hombres casados. Todos 
tenían mascotas. Cien mujeres y 36 hombres contestaron que sus mascotas sabían escuchar 
mejor que sus cónyuges. A un nivel de significancia de 0.05, ¿existe una diferencia entre las res- 
puestas de hombres y mujeres? 

40 . La National Basketball Association tiene 39 altos ejecutivos de color (presidentes o vicepresiden- 
tes) entre sus 388 directivos. Por su parte, la Major League Baseball tiene sólo 1 1 miembros de 
color entre sus 307 altos administradores. A un nivel de significancia de 0.05, prueba si estos datos 
revelan que la NBA tiene una participación significativamente mayor de directivos de color en los 
altos niveles de administración. 

41 . Una de las preguntas más apremiantes en la industria de la música es: ¿Las tiendas de pago en 
internet son competitivas frente a los servicios gratuitos para bajar música proporcionados por los 
portales de usuarios para usuarios (P2P)? Los datos recopilados durante los últimos 12 meses 
revelaron que, en promedio, 1 .65 millones de hogares usaban ¡Tunes, de Apple, con una desvia- 
ción estándar de 0.56 millones unidades familiares. Durante los mismos 12 meses, un promedio 
de 2.2 millones de familias usaban WinMx (un servicio de descarga P2P gratuito) con una desvia- 
ción estándar de la muestra de 0.30 millones. Suponga que las desviaciones estándares de las 
poblaciones no son iguales. Con un nivel de significancia de 0.05, pruebe ia hipótesis de que no 
hay diferencia entre los números medios de hogares que eligen cualquiera de los dos servicios de 
descarga de música. 

42 . Los negocios, en particular los de la industria de preparación de alimentos, como General Mills, 
Kellog y Betty Crocker, dan cupones para fomentar la lealtad a su marca y estimular sus ventas. 
Se desea saber si los usuarios de cupones de papel son diferentes de los usuarios de cupones 
electrónicos (distribuidos por internet). En una encuesta se registró la edad de cada persona que 
usaba los cupones junto con el tipo de cupón (electrónico o de papel). La muestra de 35 usuarios 
de cupones electrónicos tenía una edad media de 33.6 años, con una desviación estándar de 1 0.9, 
en tanto que una muestra similar de 25 usuarios tradicionales de cupones de papel tenía una edad 
media de 39.5 años, con desviación estándar de 4.8. Suponga que las desviaciones estándares 
de las poblaciones no son iguales. Con un nivel de significancia de 0.01, compruebe la hipóte- 
sis de que no hay diferencia entre las edades medias de los grupos de usuarios de cupones. 

43 . El propietario de hamburguesas Bun ‘N’ Run desea comparar las ventas por día en dos sucursa- 
les. El número medio de ventas de 10 días seleccionados al azar en la sucursal del lado norte fue 
83.55, con una desviación estándar de 10.50. En una muestra aleatoria de 12 días en la sucursal 
del lado sur, el número medio de ventas fue 78.80, con una desviación estándar de 14.25. Con un 
nivel de significancia de 0.05, ¿hay alguna diferencia entre los números medios de hamburguesas 
que venden las dos sucursales? ¿Cuál es el valor p? 

44 . El departamento de ingeniería de Sims Software, Inc., desarrolló dos soluciones químicas diseña- 
das para aumentar la vida útil de los discos de computadora. Una muestra de discos que se tra- 
taron con la primera solución duró 86, 78, 66, 83, 84, 81, 84, 109, 65 y 102 horas. Los discos 
tratados con la segunda solución duraron 91, 71, 75, 76, 87, 79, 73, 76, 79, 78, 87, 90, 76 y 72 
horas. Suponga que las desviaciones estándares de las poblaciones no son iguales. Con un nivel 
de significancia de 0.10, ¿puede concluir que hay una diferencia entre las duraciones de los dos 
tipos de tratamientos? ^ 

45 . El centro comercial de descuento Willow Run tiene dos tiendas Haggar, una en la avenida Peach 
y la otra en la avenida Plum. Las dos tiendas están diseñadas de forma distinta, pero ambos geren- 
tes afirman que su diseño maximiza las cantidades de artículos que los clientes comprarán por 
impulso. Una muestra de 10 clientes de la tienda de la avenida Peach reveló que gastan las can- 
tidades siguientes, adicionales a lo planeado: $17.58, $19.73, $12.61, $17.79, $16.22, $15.82, 
$1 5.40, $1 5.86, $1 1 .82 y $1 5.85. Una muestra de 1 4 clientes de la tienda de la avenida Plum reve- 
ló que gastan las cantidades siguientes, adicionales a lo planeado: $1 8.1 9, $20.22, $1 7.38, $1 7.96, 
$23.92. $15.87, $16.47, $15.96, $16.79, $16.74, $21.40, $20.57, $19.79 y $14.83. Con un nivel de 
significancia de 0.01 , ¿hay alguna diferencia entre las cantidades medias compradas por impulso 
en las dos tiendas? 

46 . El centro médico Grand Strand Family se diseñó para atender emergencias médicas menores de 
los habitantes del área de Myrtle Beach. Hay dos instalaciones, una en Little River Area y la otra 
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en Murrells Inlet. El departamento de control de calidad desea comparar los tiempos de espera 
medios de los pacientes en las dos ubicaciones. Las muestras de los tiempos de espera, en minu- 
tos, son: 


Ubicación 





Tiempo de espera 



Little River 

31.73 

28.77 

29.53 

22.08 

29.47 18.60 32.94 25.18 

29.82 

26.49 

Murrells Inlet 

22.93 

23.92 

26.92 

27.20 

26.44 25.62 30.61 29.44 

23.09 

23.10 26.69 22.31 


Suponga que las desviaciones estándares de las poblaciones no son iguales. Con un nivel de sig- 
nificancia de 0.05, ¿hay alguna diferencia entre los tiempos medios de espera? 

47. El Commercial Bank and Trust Company estudia el uso de sus cajeros automáticos. De interés par- 
ticular es si los adultos jóvenes (menores de 25 años) emplean las máquinas más que los adultos 
de la tercera edad. Para investigar más, se seleccionaron muestras de clientes menores de 25 
años de edad y de más de 60. Se determinó el número de transacciones en cajeros automáticos 
que cada individuo seleccionado realizó el mes pasado, cuyos resultados se muestran a continua- 
ción. Con un nivel de significancia de 0.01, ¿se puede concluir que los clientes más jóvenes utili- 
zan más los cajeros automáticos? C 


Menores de 25 años 

10 

10 11 15 

7 

11 

10 

9 



Mayores de 60 años 

4 

8 7 7 

4 

5 

1 

7 

4 10 

5 


48. Dos veleros, el Prada (Italia) y el Oracle (Estados Unidos), compiten por la clasificación en la pró- 
xima carrera de la Copa América. Compiten sobre una parte de la ruta varias veces. A continua- 
ción se muestran los tiempos de las muestras en minutos. Suponga que las desviaciones 
estándares de las poblaciones no son iguales. Con un nivel de significancia de 0.05, ¿puede con- 
cluir que hay una diferencia entre sus tiempos medios? Ct 


Velero 




Tiempo (minutos) 




Prada (Italia) 

12.9 

12.5 

11.0 

13.3 11.2 11.4 11.6 

12.3 

14.2 

11.3 

Oracle (Estados Unidos) 

14.1 

14.1 

14.2 

17.4 15.8 16.7 16.1 

13.3 

13.4 

13.6 10.8 19.0 


49. El fabricante de un reproductor MP3 desea saber si una reducción de 10% de precio es suficien- 
te para aumentar las ventas de su producto. Para saberlo con certeza, el propietario selecciona al 
azar ocho tiendas y vende el reproductor MP3 al precio reducido. En siete tiendas seleccionadas 
al azar, el aparato se vendió al precio normal. A continuación se presenta el número de unidades 
que se vendieron el mes pasado en las tiendas muestreadas. Con un nivel de significancia de 0.01 , 
¿puede concluir el fabricante que la reducción de precio generó un aumento de ventas? m 


Precio normal 

138 

121 

88 

115 

141 

125 

96 


Precio reducido 

128 

134 

152 

135 

114 

106 

112 

120 


50. Ocurre cierto número de accidentes automovilísticos menores en varias intersecciones de alto 
riesgo en Tetón County, a pesar de los semáforos. El departamento de tránsito afirma que una 
modificación del tipo de semáforos reducirá estos accidentes. Los comisionados del condado 
acordaron poner en práctica un experimento. Se eligieron ocho intersecciones al azar y se modi- 
ficaron los semáforos. Los números de accidentes menores durante un periodo de seis meses 
antes y después de las modificaciones fueron: ^ 




Número de accidentes 





A 

B C 

D 

E 

F 

G 

H 

Antes de la modificación 

5 

7 6 

4 

8 

9 

8 

10 

Después de la modificación 

3 

7 7 

0 

4 

6 

8 

2 


Con un nivel de significancia de 0.01, ¿es razonable concluir que la modificación redujo el núme- 
ro de accidentes de tránsito? 
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51. Lester Hollar es vicepresidente de recursos humanos de una compañía manufacturera importan- 
te. En años recientes notó un aumento del absentismo que considera se relaciona con ia salud 
general de los empleados. Hace cuatro años, en un intento para mejorar la situación, inició un pro- 
grama de acondicionamiento físico en ei cual los empleados se ejercitan durante la hora del 
almuerzo. Para evaluar el programa, seleccionó una muestra aleatoria de ocho participantes y 
determinó el número de días que cada uno se ausentó del trabajo en los seis meses antes del ini- 
cio del programa de ejercicio y en los últimos seis meses. A continuación se presentan los resul- 
tados. Con un nivel de significancia de 0.05, ¿se puede concluir que disminuyó el número de 
ausencias? Estime ei valor p. 


Empleado 

Antes 

Después 

1 

6 

5 

2 

6 

2 

3 

7 

1 

4 

7 

3 

5 

4 

3 

6 

3 

6 

7 

5 

3 

8 

6 

7 


52. 


El presidente del American Insurance Institute desea comparar los costos anuales de los seguros 
para automóvil que ofrecen dos compañías. Selecciona una muestra de 15 familias, algunas con 
sólo un conductor asegurado, otras con varios conductores adolescentes, y le paga a cada fami- 
lia una cuota para contactar a las dos compañías y pedir una estimación del costo del seguro. Para 
hacer comparables los datos, estandariza ciertas características, como la cantidad del deducible 
y los límites de la cobertura. La información muestral se reporta a continuación. Con un nivel de 
significancia de 0.10, ¿se puede concluir que hay una diferencia en las cantidades estimadas? 



Familia 

Seguro progresivo 
del automóvil 

Seguro 
de GEIC0 

Becker 

$2 090 

$1 610 

Berry 

1 683 

1 247 

Cobb 

1 402 

2 327 

Debuck 

1 830 

1 367 

DuBrui 

930 

1 461 

Eckroate 

697 

1 789 

Germán 

1 741 

1 621 

Glasson 

1 129 

1 914 

King 

1 018 

1 956 

Kucic 

1 881 

1 772 

Meredith 

1 571 

1 375 

Obeid 

874 

1 527 

Pnce 

1 579 

1 767 

Phillips 

1 577 

1 636 

Tresize 

860 

1 188 


53. La inmobiliaria Fairfield Homes desarrolla dos áreas cerca de Pigeon Fork, Tennessee. A fin de pro- 
bar estrategias publicitarias distintas, utiliza medios diferentes para llegar a los compradores 
potenciales. El ingreso familiar anual medio de 15 personas del primer desarrollo es de $150 000, 
con una desviación estándar de $40 000. Una muestra correspondiente de 25 personas del segun- 
do desarrollo obtuvo una media de $180 000, con una desviación estándar de $30 000. Suponga 
que las desviaciones estándares de las poblaciones son iguales. Con un nivel de significancia de 
0.05, ¿puede la inmobiliaria Fairfield concluir que las medias poblacionales son diferentes? 

54. Los datos siguientes resultaron de una prueba de degustación de dos barras de chocolate distin- 
tas. El primer número es una calificación del sabor, la cual puede variar de 0 a 5, en la cual 5 indi- 
ca que a la persona le gustó el sabor. El segundo número indica si estaba presente un “ingrediente 
secreto”. Si el ingrediente estaba presente se usó un código de “1”, y de “0” si no lo estaba. 
Suponga que las desviaciones estándares de las poblaciones son iguales. Con un nivel de signi- 
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ficancia de 0.05, ¿revelan estos datos una diferencia entre las calificaciones del sabor del choco- 
late? 


Calificación 

Con/sin 

Calificación 

Con/sin 

3 

1 

1 

1 

1 

1 

4 

0 

0 

0 

4 

0 

2 

1 

2 

1 

3 

1 

3 

0 

1 

1 

4 

0 


55. Una Investigación acerca de la eficacia de un jabón antibacterial para reducir la contaminación de 
una sala de operaciones generó la tabla siguiente. El jabón nuevo se probó en una muestra 
de ocho salas de operación en el área de Seattle durante el año pasado. ^ [S 






Sala de operaciones 




A 

B 

C 

D 

E F 

G 

H 

Antes 

6.6 

6.5 

9.0 

10.3 

11.2 8.1 

6.3 

11.6 

Después 

6.8 

2.4 

7.4 

8.5 

8.1 6.1 

3.4 

2.0 


A un nivel de significancia de 0.05, ¿se puede concluir que las mediciones de contaminación son 
menores después del uso del jabón nuevo? 

56. Los datos siguientes sobre las tasas de recuperación anuales se recopilaron de cinco tipos de 
acciones que se cotizan en la Bolsa de Valores de Nueva York (“el gran tablero”) y cinco que lo 
hacen en NASDAQ. Suponga que las desviaciones estándares de las poblaciones son iguales. Con 
un nivel de significancia de 0.10, ¿se puede concluir que las tasas de recuperación anuales son 
mayores en “el gran tablero”? 5¡[ji 


NYSE 

NASDAQ 

17.16 

15.80 

17.08 

16.28 

15.51 

16.21 

8.43 

17.97 

25.15 

7.77 


57. La ciudad de Laguna Beach opera dos estacionamientos públicos. El de Ocean Drive tiene capa- 
cidad para 125 automóviles, y el de Rio Rancho, para 130. Los planeadores urbanos consideran 
tanto aumentar el tamaño de los estacionamientos como cambiar la estructura de las tarifas. Para 
iniciar, la oficina de planeación desea conocer el número de automóviles que hay en los estacio- 
namientos en diversas horas del día. Se encarga a un funcionario de planeación principiante la 
tarea de visitar los dos estacionamientos a horas aleatorias del día y la tarde para contar el núme- 
ro de vehículos estacionados en ellos. El estudio se realizó durante un periodo de un mes. A con- 
tinuación se presenta el número de automóviles en los estacionamientos durante 25 visitas al 
estacionamiento Ocean Drive y 28 al Rio Rancho. Suponga que las desviaciones estándares de las 
poblaciones son iguales. 


Ocean Drive 

89 115 

93 

79 

113 

77 

51 

75 

118 

105 

106 

91 

54 

63 

121 

53 

81 

115 

67 

53 

69 

95 

121 

88 

64 


Rio Rancho 

128 110 

81 

126 

82 

114 

93 

40 

94 

45 

84 

71 

74 

92 

66 

69 

100 

114 

113 

107 

62 

77 

80 

107 

90 

129 

105 

124 













¿Es razonable concluir que hay una diferencia entre los números medios de automóviles en los dos 
estacionamientos? Utilice el nivel de significancia 0.05. 
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58. La cantidad de ingresos que se gasta en vivienda es una componente importante del costo de 
vida. Para los propietarios, los costos totales de vivienda incluyen pagos de la hipoteca, impues- 
to predial y de servicios (agua, calefacción, electricidad). Un economista seleccionó una muestra 
de 20 propietarios en Nueva Inglaterra, hace cinco años y en la actualidad, y después calculó estos 
costos totales de vivienda como porcentaje del ingreso mensual. La información se reporta a con- 
tinuación. ¿Es razonable concluir que el porcentaje es menor en la actualidad que hace cinco 
años? SfíS 


Propietario 

Hace cinco años 

Actualmente 

Propietario 

Hace cinco años 

Actualmente 

1 

17% 

10% 

11 

35% 

32% 

2 

20 

39 

12 

16 

32 

3 

29 

37 

13 

23 

21 

4 

43 

27 

14 

33 

12 

5 

36 

12 

15 

44 

40 

6 

43 

41 

16 

44 

42 

7 

45 

24 

17 

28 

22 

8 

19 

26 

18 

29 

19 

9 

49 

28 

19 

39 

35 

10 

49 

26 

20 

22 

12 


59 - 60 . Utilice la siguiente información para hacer los ejercicios 59 y 60. Muestra los conductores, edades, probabilidades en con- 
tra de ganar, fila de posición inicial y número de auto de la carrera de Indianápolis 500 de 2008. Utilice un nivel de sig- 
nificancia de 0.01 . 


Conductor 

Edad 

En contra 

Fila 

Número 
de auto 

Conductor 

Edad 

En contra 

Fila 

Número 
de auto 

Dixon 

27 

4 

1 

9 

Hamilton 

45 

100 

6 

22 

Wheldon 

29 

4 

1 

10 

Uoyd 

23 

200 

7 

16 

Briscoe 

26 

4 

1 

6 

Hunter-Reay 

27 

100 

7 

17 

Castroneves 

33 

4 

2 

3 

Andretti, J 

45 

100 

7 

24 

Patrick 

26 

8 

2 

7 

Fisher 

27 

200 

8 

67 

Kanaan 

33 

4 

2 

11 

Power 

27 

100 

8 

8 

Andretti, M 

21 

8 

3 

26 

Simmons 

31 

200 

8 

41 

Meira 

31 

25 

3 

4 

Servia 

33 

150 

9 

5 

Mutoh 

25 

20 

3 

27 

Viso 

23 

200 

9 

33 

Carpenter 

27 

50 

4 

20 

Duno 

36 

200 

9 

23 

Scheckter 

27 

45 

4 

12 

Moraes 

19 

200 

10 

19 

Bell 

33 

200 

4 

99 

Bernoldi 

29 

200 

10 

36 

Rahal 

19 

40 

5 

6 

Camara 

27 

200 

10 

34 

Manning 

33 

100 

5 

14 

Foyt 

24 

150 

11 

2 

Junqueira 

31 

75 

5 

18 

Lazier 

40 

150 

11 

91 

Wilson 

29 

50 

6 

2 

Roth 

49 

300 

11 

25 

Rice 

32 

50 

6 

15 







59 . ¿Es razonable concluir que iniciar en las primeras cinco filas aumente significativamente las pro- 
babilidades de ganar, en contra de las últimas cuatro filas? 

60 . ¿Tener un auto con número 20 o menor cambia significativamente las probabilidades de ganar? 


Ejercicios de lo base de datos 

61 . Consulte los datos sobre Real State, los cuales reportan información sobre las casas que se ven- 
dieron el año pasado en Goodyear, Arizona. 

a) Con un nivel de significancia de 0.05, ¿puede concluir que hay una diferencia entre los precios 
de venta medios de las casas con alberca y sin ella? 
ib) Con un nivel de significancia de 0.05, ¿concluye que hay una diferencia entre los precios de 
venta medio de las casas con cochera y sin ella? 


Comandos de software 
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c) Con un nivel de significancia de 0.05, ¿puede concluir que hay una diferencia entre los precios 
de venta medios de las casas en Township 1 y Township 2? 

d) Determine el precio de venta mediano de las casas. Divida las casas en dos grupos: las que se 
vendieron en una cantidad mayor (o igual) ai precio mediano y las que se vendieron en una can- 
tidad menor que el precio mediano. Utilice el nivel de significancia de 0.05. 

e) Redacte un reporte en el cual resuma sus hallazgos en los incisos a), b ), c) y d). Dirija el repor- 
te a todos los corredores de bienes raíces que venden propiedades en Goodyear. 

62. Consulte los datos de Baseball 2009, en los cuales se proporciona información sobre los 30 equi- 
pos de la Liga Mayor de Béisbol de la temporada 2009. 

a) Con un nivel de significancia de 0.05, ¿puede concluir que hay una diferencia en el salario 
medio de los equipos en la Liga Americana en comparación con los de la Nacional? 

b) Con un nivel de significancia de 0.05, ¿concluye que hay una diferencia entre las asistencias 
medias como local de los equipos en la Liga Americana en comparación con los equipos de la 
Nacional? 

c) Calcule la media y la desviación estándar del número de juegos que ganaron los 1 0 equipos de 
salarios más altos. Haga lo mismo con los 10 equipos de salarios más bajos. Con un nivel 
de significancia de 0.05, ¿hay una diferencia entre los números medios de juegos ganados de 
ambos grupos? 

63. Consulte los datos de los autobuses escolares del Distrito Escolar Buena. ¿Existe alguna diferen- 
cia entre los costos medios de mantenimiento de los que utilizan diesel versus los que utilizan 
gasolina? Aplique un nivel de significancia de 0.05. 


Comandos de software 

1. Los comandos de Minitab para la prueba de proporciones 
de dos muestras en la página 381 son: 

a) En la barra de herramientas, seleccione Stat, Basic Sta- 
tistics y después 2 Proportions. 

b) En el cuadro de diálogo siguiente seleccione Summari- 
zed data, en la fila denominada First escriba 100 para 
Triáis y 19 para Events. En la fila denominada Second 
ponga 200 para Triáis y 62 para Events. Haga clic en 
Options y seleccione Use pooled estimate of p test, y 
haga clic dos veces en OK. 


2. Los comandos en Excel para la prueba t de dos muestras en 

la página 386 son: 

a) Escriba los datos en las columnas A y B (o cualesquiera 
otras columnas) en la hoja de cálculo. Utilice la prime- 
ra fila de cada columna para escribir el nombre de la va- 
riable. 

b) En la barra de menú seleccione Data. Seleccione Data 
Analysis en el extremo derecho. Seleccione t-Test: Two 
Sample Assuming Equal Variances, después haga clic 
en OK. 

c) En el cuadro de diálogo indique que el rango de la Varia- 
ble 1 es de A 7 a A6, y de la Variable 2, de B1 a B7; la 

Hypothesized Mean Difference es 0, haga clic en 
Labels, Alpha es 0.05, y el Output Range es DI. Haga 
clic en OK. 
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3. Los comandos en Minitab para la prueba de proporciones de 

dos muestras en la página 390 son: 

a) Escriba la cantidad absorbida por ia primera marca de 
toalla de papel en C7 y la cantidad que absorbió la 
segunda en C2. 

b) En la barra de herramientas seleccione Stat, Basic Sta- 
tistics, después 2-Sample y haga clic en OK. 

c) En el cuadro de diálogo siguiente seleccione Samples in 
different columns, seleccione C7 Store para la columna 
First y C2 Ñame de la Second, y haga clic en OK. 


4. Los comandos en Excel para la prueba t por pares de la 

página 395 son: 

a) Escriba los datos en las columnas B y C (o cualesquiera 
otras dos columnas) en la hoja de cálculo, con los nom- 
bres de las variables en la primera fila. 

b) En la barra de menú seleccione Data. Seleccione Data 
Analysis en la extrema derecha. Seleccione t-Test: Pai- 
red Two Sample for Means, después haga clic en OK. 

c) En el cuadro de diálogo indique que el rango de la Varia- 
ble 1 es de B1 a B11, y de la Variable 2, de C1 a C7 7; 
la Hypothesized Mean Difference es 0, haga clic en 
Labels, Alpha es 0.05, y el Output Range es El . Haga 
clic en OK. 




Capítulo 11 


Respuestas a las autoevaluaciones 



11-1 a) 77 0 : il w < [l m 

/+,: \x, w > fx/ví 

El subíndice W se refiere a las mujeres, y M, a los 
hombres. 

b) Se rechaza 74 0 si z > 1 .65. 

$1 500 - $1 400 
°' Z /($ 250) 2 ($200) 2 “ ' 

V 50 + 40 

d) Se rechaza la hipótesis nula. 

e) Valor p = .5000 - .4826 = .0174 

f) La cantidad media vendida por día es mayor para las 
mujeres. 

11-2 a) H q \ tt 1 = tt 2 
77 1 : tt 1 tt 2 

b) 0.10 

c) Dos colas 

d) Se rechaza H 0 si z es menor que -1 .65 o mayor que 
1.65. 


e) p, = 


87 + 123 

210 

150 + 200 

350 

co 

LO 

II 

h- 

00 

II 

Po = 

150 


.58 - .615 

/ .60(.40) 

.60(.40) 


= .60 
123 


= .615 


200 
= - 0.66 


150 


200 


f) No se rechaza H 0 . 

g) Valor p = 2(.5000 - .2454) = .5092 

No hay diferencia en la proporción de adultos y niños a 
quienes les gustó el sabor propuesto. 

11-3 a) H 0 : |x d = |x a 
Hp p, d ^ p, a 

b) gl = 6 + 8-2 = 12. 

Se rechaza H 0 si t es menor que -2.179 o si f es 
mayor que 2.179. 
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42 

C) X, = — = 7.00 Sl = 
X 2 = ^ = 10.00 s, = 

O 


10 

6 - 1 
36T 


= 1.4142 


= 2.2678 


4 = 


8 - 1 

(6 - 1)(1 .41 42) 2 + (8 - 1)(2.2678) 2 


= 3.8333 
7.00 


t = 


6 + 8 
10.00 


V 33333 (H) 


= -2.837 


d) Se rechaza H 0 porque -2.837 es menor que el valor 
crítico. 

e) El valor p es menor que 0.02. 

f) El número medio de defectos no es el mismo en los 
dos turnos. 

g) Poblaciones independientes, las poblaciones siguen la 
distribución normal, las poblaciones tienen desviacio- 
nes estándares iguales. 

a) H 0 \ p. c > |i a H,: (x c < p, a 
[(356 2 /1 0) + (857 2 /8)] 2 


b) gt = 


(356 2 / 1 0) 2 (857 2 /8) 2 

+ 8-1 


= 8.93 


10 - 1 
así que gl = 8. 

c) Se rechaza H 0 s\t< -1 .860. 


d)t = 


$1 568 - $1 967 -399.00 


356 2 857 2 


323.23 


= -1.234 


10 8 

e) No se rechaza H 0 . 

f) No hay diferencia entre los saldos medios de la cuenta 
de los que solicitaron la tarjeta de crédito o fueron 
contactados por teléfono por un agente. 


11-5 a) H 0 : < 0, /+,: > 0. 

b) Se rechaza H 0 s\t> 2.998. 


Nombre 

Antes 

Después d 

(d- d) 

(d - d) 2 

Hunter 

155 

154 

1 

-7.875 

62.0156 

Cashman 

228 

207 

21 

12.125 

147.0156 

Mervlne 

141 

147 

-6 

-14.875 

221.2656 

Massa 

162 

157 

5 

-3.875 

15.0156 

Creóla 

211 

196 

15 

6.125 

37.5156 

Peterson 

164 

150 

14 

5.125 

26.2656 

Redding 

184 

170 

14 

5.125 

26.2656 

Poust 

172 

165 

7 

-1.875 

3.5156 




71 


538.8750 


d = — = 8.875 
8 


/ 538.875 

V 8-1 


8.774 


8.875 

8.774/V8 


2.861 


d) No se rechaza H 0 . No se puede concluir que los estu- 
diantes bajaron de peso. El valor p es menor que 
0.025 pero mayor que 0.01 . 

e) La distribución de las diferencias debe seguir una dis- 
tribución normal. 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Enumerar las 
características de la 
distribución F y localizar 
valores en una tabla F. 

OA2 Realizar una prueba de 
hipótesis para determinar si 
las varianzas de dos 
poblaciones son ¡guales. 

OA3 Describir el enfoque 
ANOVA para probar 
diferencias en medias 
muéstrales. 

OA4 Organizar datos en una 
tabla ANOVA para su análisis. 

OA5 Realizar una prueba de 
hipótesis entre tres o más 
medias de tratamiento y 
describir los resultados. 

OA6 Desarrollar los intervalos 
de confianza de la diferencia 
entre medias de tratamiento e 
interpretar los resultados. 




OA7 Realizar una prueba de 
hipótesis entre medias de 
tratamiento con una variable 
de bloqueo. 

OA8 Realizar una ANOVA de 
dos vías con interacción y 
describir los resultados. 


Un fabricante de computadoras está a punto de presentar una nueva 
computadora personal más rápida. Sin duda, la máquina nueva es más 
rápida, pero las pruebas iniciales indican que el tiempo de procesamiento 
varía más, variación que depende del programa que se ejecute, y de la 
cantidad de datos de entrada y salida. Una muestra de 16 corridas de la 
computadora, con diversos trabajos de producción, reveló que la desviación 
estándar del tiempo de procesamiento de la máquina nueva fue de 22 
(centésimas de segundo) y de 12 (centésimas de segundo) la del modelo 
actual. Con un nivel de significancia de 0.05, ¿puede concluir que el tiempo 
de procesamiento de la máquina nueva varía más? (ejercicio 24, objetivo 2). 



12.2 La distribución F 
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12.1 Introducción 

En este capítulo se continúa el análisis de las pruebas de hipótesis. Recuerde que en los capí- 
tulos 10 y 11 estudió la teoría general de las pruebas de hipótesis. Se analizó el caso en que 
se seleccionó una muestra de una población. Se utilizó la distribución z (la distribución normal 
estándar) o la distribución t para determinar si era razonable concluir que la media poblacio- 
nal era igual a un valor específico. Se probó si dos medias poblacionales eran iguales. También 
se realizaron pruebas de una y dos muestras de las proporciones de las poblaciones, con la 
distribución normal estándar como la distribución del estadístico de prueba. En este capítulo 
se amplía la idea de pruebas de hipótesis. Se describe una prueba para varianzas y, después, 
una prueba que compara de forma simultánea varias medias para determinar si provienen de 
poblaciones iguales. 


OA1 Enumerar las 
características de la 
distribución F y localizar 
valores en una tabla F. 


12.2 La distribución F 

La distribución de probabilidad que se emplea en este capítulo es la distribución F, la cual 
debe su nombre a sir Ronald Fisher, uno de los pioneros de la estadística actual. Esta distri- 
bución de probabilidad sirve como la distribución del estadístico de prueba en varias situacio- 
nes. Con ella se pone a prueba si dos muestras provienen de poblaciones que tienen varianzas 
iguales, y también se aplica cuando se desea comparar varias medias poblacionales en forma 
simultánea. La comparación simultánea de varias medias poblacionales se denomina análisis 
de la varianza (ANOVA). En las dos situaciones, las poblaciones deben seguir una distribu- 
ción normal, y los datos deben ser al menos de escala de intervalos. 

¿Cuáles son las características de la distribución F? 

1. Existe una familia de distribuciones F. Cada miembro de la familia se determina me- 
diante dos parámetros: los grados de libertad del numerador y los grados de libertad del 
denominador. La forma de la distribución se ilustra en la siguiente gráfica. Hay una distri- 
bución F de la combinación de 29 grados de libertad del numerador (gl ) y los 28 grados 
de libertad del denominador. Existe otra distribución F de los 19 grados en el numerador 
y los 6 grados de libertad del denominador. La distribución final que se muestra tiene 6 
grados de libertad en el numerador y 6 grados de libertad en el denominador. Los grados 
de libertad se describen más adelante en este capítulo. Observe que la forma de las cur- 
vas cambia cuando varían los grados de libertad. 



2. La distribución F es continua. Esto significa que se supone un número infinito de valo- 
res entre cero y el infinito positivo. 

3. La distribución F no puede ser negativa. El menor valor que F puede tomar es 0. 
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OA2 Realizar una prueba de 
hipótesis para determinar si 
las varianzas de dos 
poblaciones son iguales. 


4. Tiene sesgo positivo. La cola larga de la distribución es hacia el lado derecho. Cuando 
el número de grados de libertad aumenta, tanto en el numerador como en el denomina- 
dor, la distribución se aproxima a ser normal. 

5. Es asintótica. Cuando los valores de X aumentan, la curva F se aproxima al eje X pero 
nunca lo toca. Este caso es similar al comportamiento de la distribución de probabilidad 
normal, descrito en el capítulo 7. 

12.3 Comparación de dos 
varianzas poblacionales 

La primera aplicación de la distribución F ocurre cuando se pone a prueba la hipótesis de que 
la varianza de una población normal es Igual a la varianza de otra población normal. En los 
siguientes ejemplos se muestra el uso de la prueba: 

• Dos máquinas esquiladoras de la marca Barth se calibran para producir barras de acero 
con la misma longitud. Por lo tanto, las barras deberán tener la misma longitud media. Se 
desea tener la seguridad de que además de la misma longitud media también tengan una 
variación similar. 

• El índice de rendimiento medio de los dos 
tipos de acciones comunes puede ser el mis- 
mo, pero quizá varíe más el índice de rendi- 
miento de un tipo que el otro. Una muestra de 
10 acciones relacionadas con la tecnología 
y 10 acciones de compañías de servicios pre- 
sentan el mismo índice de rendimiento medio, 
pero es probable que varíen más las acciones 
vinculadas a la tecnología. 

• Un estudio del departamento de marketing de 
un periódico importante reveló que los hom- 
bres y las mujeres pasan cerca de la misma 
cantidad de tiempo por día navegando por la 

red. Sin embargo, el mismo reporte indica que la variación del tiempo pasado por día por 
los hombres casi duplicaba al de las mujeres. 

La distribución F también sirve para probar suposiciones de algunas pruebas estadísticas. 
Recuerde que en el capítulo anterior se utilizó la prueba f para investigar si las medias de dos 
poblaciones independientes eran diferentes. Para emplear esa prueba, algunas veces se 
supone que las varianzas de dos poblaciones normales son ¡guales. Vea la lista de suposicio- 
nes en la sección 11.4, página 384. La distribución F proporciona un medio para realizar una 
prueba considerando las varianzas de dos poblaciones normales. 

Sin importar si se desea determinar si una población varía más que otra o validar una 
suposición de una prueba estadística, primero se formula la hipótesis nula. La hipótesis nula es 
que la varianza de una población normal, o^, es Igual a la varianza de otra población normal, 
o|. La hipótesis alternativa podría ser que las varianzas difieren. En este caso, las hipótesis 
nula y alternativa son: 



H 0 : crf — cr| 

Hf'. cti =7= o| 

Para realizar la prueba, se selecciona una muestra aleatoria de n 1 observaciones de una pobla- 
ción y una muestra aleatoria de n 2 observaciones de la segunda población. El estadístico de 
prueba se define como sigue. 


ESTADÍSTICO DE PRUEBA PARA 
COMPARAR DOS VARIANZAS 





( 12 - 1 ) 


V 
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Los términos s 2 y s| son las varianzas muéstrales respectivas. Si la hipótesis nula es verdade- 
ra, el estadístico de prueba sigue la distribución F con n 1 - 1 y n 2 - 1 grados de libertad. A fin 
de reducir el tamaño de la tabla de valores críticos, la varianza más grande de la muestra se 
coloca en el numerador; de aquí, la razón F que se indica en la tabla siempre es mayor que 
1 .00. Así, el valor crítico de la cola derecha es el único que se requiere. El valor crítico de F de 
una prueba de dos colas se determina dividiendo el nivel de significancia entre dos (a/2) y des- 
pués se consultan los grados de libertad apropiados en el apéndice B.4. Un ejemplo servirá 
de ilustración. 


Cjemplo 



Lammers Limos ofrece servicio de transporte en 
limusina del ayuntamiento de Toledo, Ohio, al 
aeropuerto metropolitano de Detroit. Sean Lam- 
mers, presidente de la compañía, considera dos 
rutas. Una por la carretera 25 y la otra por la auto- 
pista 1-75. Lammers desea estudiar el tiempo que 
tardaría en conducir al aeropuerto por cada una 
de las rutas y luego comparar los resultados. 
Recopiló los siguientes datos muéstrales, repor- 
tados en minutos. Usando el nivel de significancia 
de 0.10, ¿hay alguna diferencia entre las variacio- 
nes de los tiempos de manejo por las dos rutas? 


Carretera 25 

Autopista 1-75 

52 

59 

67 

60 

56 

61 

45 

51 

70 

56 

54 

63 

64 

57 


65 


Solución 


Los tiempos de manejo medios por las dos rutas son casi iguales. El tiempo medio es de 58.29 
minutos por la carretera 25 y de 59.0 minutos por la autopista 1-75. Sin embargo, al evaluar los 
tiempos de recorrido, Lammers también está interesado en la variación de ellos. El primer paso 
es calcular las dos varianzas muéstrales. Se empleará la fórmula (3-11) para determinar la des- 
viación estándar de cada muestra; para obtener la varianza muestral se eleva al cuadrado la 
desviación estándar. 


Carretera 25 


x = 


2X 

n 


408 


= 58.29 


s = 


Autopista 1-75 


x = 


sx 

n 


472 

8 


= 59.00 


s = 


2(X - X) 2 
n - 1 


2(X - X) 2 
n - 1 


485.43 
7 - 1 


= 8.9947 


134 
8 - 1 


= 4.3753 


Según la medición de la desviación estándar, hay más variación en la carretera 25 que en la 
autopista 1-75. Esto coincide con su conocimiento de las dos rutas; la ruta por la carretera 25 
tiene más semáforos, en tanto que la autopista 1-75 es de acceso limitado. Sin embargo, la ruta 
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por la autopista 1-75 es varias millas más larga. Es importante que el servicio que ofrece sea 
tanto puntual como consistente, por lo que decide realizar una prueba estadística para deter- 
minar si en realidad existe una diferencia entre las variaciones de las dos rutas. 

Empleará el procedimiento habitual de la prueba de hipótesis de cinco pasos. 

Paso 1 : Inicia por formular las hipótesis nula y alternativa. La prueba es de dos colas debi- 
do a que se busca una diferencia entre las variaciones de las dos rutas. No se 
trata de demostrar que el tiempo que se emplea varía más por una ruta que por 
la otra. 

H o '■ o"? = CT 2 

Hy ^ CTg 

Paso 2: Selecciona el nivel de significancia de 0.10. 

Paso 3: El estadístico de prueba apropiado sigue la distribución F. 

Paso 4: Obtiene el valor crítico del apéndice B.4, del cual se reproduce una parte como 
tabla 12-1. Puesto que conduce una prueba de dos colas, el nivel de significan- 
cia en la tabla es 0.05, determinado mediante a/2 = 0.10/2 = 0.05. Hay n-¡ - 1 = 
7-1=6 grados de libertad en el numerador, y n 2 - 1 = 8-1 = 7 grados de liber- 
tad en el denominador. Para encontrar el valor crítico, recorre en forma horizontal 
la parte superior de la tabla F (tabla 12-1 o apéndice B.4) del nivel de significan- 
cia 0.05 con 6 grados de libertad en el numerador. Después va hacia abajo por 
esa columna hasta el valor crítico opuesto a 7 grados de libertad en el denomina- 
dor. El valor crítico es 3.87. Por lo tanto, la regla de decisión es: rechazar la hipó- 
tesis si la razón de las varianzas muéstrales es mayor que 3.87. 

TABLA 12-1 Valores críticos de la distribución F, a = 0.05 


Grados de 
libertad del 
denominador 

Grados de libertad del numerador 





8 

5 

6 

7 

1 

230 

234 

237 

239 

2 

19.3 

19.3 

19.4 

19.4 

3 

9.01 

8.94 

8.89 

8.85 

4 

6.26 

6.16 

6.09 

6.04 

5 

5.05 

4.95 

4.88 

4.82 

6 

4.39 

4.28 

4.21 

4.15 

rr~ 

3.97 

3.87 | 

3.79 

373 ] 

8 

3.69 

3.58 

3.50 

3.44 

9 

3.48 

3.37 

3.29 

3.23 

10 

3.33 

3.22 

3.14 

3.07 


Paso 3: Por último debe tomar la razón de las dos varianzas muéstrales, determinar el 
valor del estadístico de prueba y tomar una decisión respecto de la hipótesis nula. 
Observe que la fórmula (12-1) se refiere a las varianzas muéstrales, pero se calcu- 
laron las desviaciones estándares de las muestras, las cuales se deben elevar al 
cuadrado para determinar las varianzas. 


s? _ (8.9947) 

| “ (4.3753) 2 


La decisión es rechazar la hipótesis nula, debido a que el valor F calculado (4.23) 
es mayor que el valor crítico (3.87). Se concluye que hay una diferencia entre las 
variaciones de los tiempos de recorrido por las dos rutas. 
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Como se hizo notar, la práctica habitual es determinar la razón F poniendo la mayor de las dos 
varianzas muéstrales en el numerador, lo cual hará que la razón F sea al menos 1 .00 y permi- 
tirá utilizar siempre la cola derecha de la distribución F para evitar la necesidad de requerir 
tablas F más extensas. 

Respecto de las pruebas de una cola surge una duda lógica. Por ejemplo, suponga que 
en el ejemplo anterior sospecha que la varianza de los tiempos en la carretera 25 es mayor 
que la varianza de los tiempos por la autopista 1-75. Las hipótesis nula y alternativa deberán 
ser de la siguiente forma: 

^o- CT i ~ °2 

H 1 : crf > <x¡ 

El estadístico de prueba se calcula como s\ls\. Observe que se designó población 1 a la que 
se sospecha que tiene la varianza mayor. Por lo tanto, aparece en el numerador. La razón F 
será mayor que 1 .00, por lo que se puede utilizar la cola superior de la distribución F. Con 
estas condiciones, no es necesario dividir el nivel de significancia a la mitad. Como en el apén- 
dice B.4 sólo se dan niveles de significancia de 0.05 y 0.1 0, estamos restringidos a estos nive- 
les en el caso de pruebas de una cola y con 0.10 y 0.02 en el de pruebas de dos colas, a 
menos que se consulte una tabla más completa o se utilice software estadístico para calcular 
el estadístico F. 

El programa Excel tiene un procedimiento para realizar una prueba de varianzas. A conti- 
nuación se presenta la captura de pantalla. El valor calculado de F es el mismo que se deter- 
minó con la fórmula (12-1). 




Steele Electric Products, Inc., ensambla componentes eléctricos para teléfonos celulares. Durante 
los últimos 10 días, Mark Nagy ha promediado 9 productos rechazados, con una desviación están- 
dar de 2 rechazos por día. Debbie Richmond promedió 8.5 productos rechazados, con una desvia- 
ción estándar de 1 .5 rechazos durante el mismo periodo. Con un nivel de significancia de 0.05, 
¿podría concluir que hay más variación en el número de productos rechazados por día de Mark? 


comect 


Ejercicios 

1. ¿Cuál es el valor crítico F de una muestra de seis observaciones en el numerador y cuatro en el 
denominador? Utilice una prueba de dos colas y el nivel de significancia de 0.10. 

¿Cuál es el valor crítico F de una muestra de cuatro observaciones en el numerador y siete en el 
denominador? Utilice una prueba de una cola y el nivel de significancia de 0.01. 


2 . 
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El uso de la distribución t 
conduce a la acumulación del 
error tipo I. 


3. Se dan las siguientes hipótesis. 

H a . a? = 

Hy ^ A a¡ 

En una muestra aleatoria de ocho observaciones de la primera población resultó una desviación 
estándar de 10. En una muestra aleatoria de seis observaciones de la segunda población resultó 
una desviación estándar de 7. A un nivel de significancia de 0.02, ¿hay alguna diferencia entre las 
variaciones de las dos poblaciones? 

4. Se dan las siguientes hipótesis. 

H 0 : a? < a¡ 

/+, : af > a¡ 

En una muestra aleatoria de cinco observaciones de la primera población resultó una desviación 
estándar de 12. Una muestra aleatoria de siete observaciones de la segunda población reveló una 
desviación estándar de 7. A un nivel de significancia de 0.01, ¿varía más la primera población? 

5. Arbitran Media Research, Inc., realiza un estudio sobre los hábitos de escuchar iPod de hombres 
y mujeres. Una parte del estudio incluyó el tiempo medio de escucha. Se descubrió que el tiempo 
medio de escucha de los hombres era de 35 minutos por día. La desviación estándar de la mues- 
tra de los 10 hombres estudiados fue de 10 minutos por día. El tiempo medio de escucha de las 
12 mujeres estudiadas también fue de 35 minutos, pero la desviación estándar muestral fue de 12 
minutos. A un nivel de significancia de 0.10, ¿puede concluir que hay una diferencia entre las varia- 
ciones de los tiempos de escucha de los hombres y las mujeres? 

6. Un corredor de bolsa de Critical Securities reportó que la tasa de rendimiento media de una mues- 
tra de 10 acciones de la industria petrolera era de 12.6%, con una desviación estándar de 3.9%. 
La tasa de rendimiento media de una muestra de 8 acciones de compañías de servicios fue de 
10.9%, con una desviación estándar de 3.5%. A un nivel de significancia de 0.05, ¿puede concluir 
que varían más las acciones de la industria petrolera? 

12.4 Suposiciones en el análisis 
de la varianza (ANOVA) 

Otro uso de la distribución F es el análisis de la técnica de la varianza (ANOVA), en la cual se 
comparan tres o más medias poblacionales para determinar si pueden ser ¡guales. Para 
emplear ANOVA, se supone lo siguiente: 

1. Las poblaciones siguen la distribución normal. 

2. Las poblaciones tienen desviaciones estándares iguales (ct). 

3. Las poblaciones son independientes. 

Cuando se cumplen estas condiciones, F se emplea como la distribución del estadístico de 
prueba. 

¿Por qué es necesario estudiar ANOVA? ¿Por qué no sólo se emplea la prueba de las dife- 
rencias entre medias poblacionales, como se analizó en el capítulo anterior? Se puede compa- 
rar dos medias poblacionales a la vez. La razón más importante es la acumulación indeseable 
del error tipo I. Para ampliar la explicación, suponga cuatro métodos distintos (A, B, C y D) para 
capacitar personal para ser bomberos. La asignación de cada uno de los 40 prospectos del 
grupo de este año es aleatoria en cada uno de los cuatro métodos. Al final del programa de 
capacitación, a los cuatro grupos se les administra una prueba común para medir la compren- 
sión de las técnicas contra incendios. La pregunta es: ¿existe una diferencia entre las califica- 
ciones medias del examen de los cuatro grupos? La respuesta a esta pregunta permitirá 
comparar los cuatro métodos de capacitación. 

Si emplea la distribución t para comparar las cuatro medias poblacionales, tendría que 
efectuar seis pruebas t distintas. Es decir, necesitaría comparar las calificaciones medias de 
los cuatro métodos como sigue: A contra B, A contra C, A contra D, B contra C, B contra D y 
C contra D. Si el nivel de significancia es de 0.05, la probabilidad de una decisión estadística 
correcta es de 0.95, calculada de 1 - 0.05. Como se realizaron seis pruebas separadas (inde- 
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OA3 Describir el enfoque 
ANOVA para probar 
diferencias entre medias 
muéstrales. 


Cjemplo 


Solución 


pendientes), la probabilidad de que no se tome una decisión incorrecta debido al error de 
muestreo en cualquiera de las seis pruebas independientes es: 

P{todas correctas) = (0.95)(0.95)(0.95)(0.95)(0.95)(0.95) = 0.735 

Para encontrar la probabilidad de que al menos tenga un error debido al muestreo, reste este 
resultado a 1. Por lo tanto, la probabilidad de al menos una decisión incorrecta debida al 
muestreo es de 1 - 0.735 = 0.265. En resumen, si realiza seis pruebas independientes con la 
distribución f, la posibilidad de rechazar una hipótesis nula verdadera debido al error de mues- 
treo se incrementa de 0.05 a un nivel insatisfactorio de 0.265. Es obvio que necesita un mejor 
método que realizar seis pruebas t. ANOVA le permite comparar las medias de tratamiento de 
forma simultánea y evitar la acumulación del error de tipo I. 

ANOVA se desarrolló para aplicaciones en agricultura, y aún se emplean muchos de los 
términos relacionados con ese contexto. En particular, con el término tratamiento se identifi- 
can las diferentes poblaciones que se examinan. Por ejemplo, el tratamiento se refiere a cómo 
se trató una extensión de terreno con un tipo particular de fertilizante. La siguiente ilustración 
aclarará el término tratamiento y mostrará la aplicación de ANOVA. 


Joyce Kuhlman es gerente de un centro financiero regional y desea comparar la productividad, 
medida por el número de clientes atendidos, de tres empleados. Selecciona cuatro días en 
forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados 
son: 



¿Hay alguna diferencia en el número medio de clientes atendidos? En la gráfica 12-1 se ilustra 
cómo pueden aparecer las poblaciones si hubiera una diferencia en las medias del tratamien- 
to. Observe que las poblaciones siguen la distribución normal y la variación en cada población 
es la misma. Sin embargo, las medias no son iguales. 



GRÁFICA 12-1 


Caso en el que las medias del tratamiento son diferentes 
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OA5 Realizar una prueba de 
hipótesis entre tres o más 
medias de tratamiento y 
describir los resultados. 


Suponga que las poblaciones son iguales. Es decir, que no hay una diferencia entre las 
medias (tratamiento). Esta igualdad, que se muestra en la gráfica 12-2, indica que las medias 
poblacionales son iguales. Observe de nuevo que las poblaciones siguen la distribución nor- 
mal, y que la variación en cada una de las poblaciones es la misma. 



fil=ft2=43 

Clientes 

atendidos 


GRÁFICA 12-2 Caso en el 


que las medias del tratamiento son iguales 


12.5 La prueba ANOVA 

¿Cómo funciona la prueba ANOVA? Recuerde que se desea determinar si varias medias 
muéstrales provienen de una sola población o de poblaciones con medias diferentes. En rea- 
lidad, estas medias muéstrales se comparan mediante sus varianzas. Para explicar esto, 
recuerde que en la página 416 se enumeraron las suposiciones que requiere ANOVA. Una de 
estas suposiciones fue que las desviaciones estándares de las diversas poblaciones normales 
tenían que ser las mismas. Se aprovecha este requisito en la prueba ANOVA. La estrategia es 
estimar la varianza de la población (desviación estándar al cuadrado) de dos formas para des- 
pués determinar la razón de dichas estimaciones. Si esta razón es aproximadamente 1 , enton- 
ces por lógica las dos estimaciones son iguales, y se concluye que las medias poblacionales 
no son iguales. La distribución F sirve como un árbitro para indicar en qué instancia la razón 
de las varianzas muéstrales es mucho mayor que 1 para haber ocurrido por casualidad. 

Consulte el ejemplo del centro financiero en la sección anterior. El gerente desea determi- 
nar si hay una diferencia entre los números medios de clientes atendidos. Para iniciar, deter- 
mine la media global de las 12 observaciones. Ésta es de 58, calculada de (55 + 54 + ■ ■ ■ + 48) 
/1 2. Después, en cada una de las 12 observaciones encuentre la diferencia entre el valor par- 
ticular y la media global. Cada una de estas diferencias se eleva al cuadrado y estos cuadra- 
dos se suman. Este término se denomina variación total. 


VARIACIÓN TOTAL Suma de las diferencias entre cada observación y la media global ele- 
vadas al cuadrado. 


En nuestro ejemplo, la variación total es de 1 082, determinada por (55 - 58) 2 + (54 - 58) 2 
+ ■■■ + (48 -58) 2 . 

Luego se divide esta variación total en dos componentes: la que se debe a los tratamien- 
tos y la que es aleatoria. Para encontrar estas dos componentes, se determina la media de 
cada tratamiento. La primera fuente de variación se debe a los tratamientos. 
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VARIACIÓN DE TRATAMIENTO Suma de las diferencias entre la media de cada tratamiento y la 
^ media total o global elevadas al cuadrado. 


En el ejemplo, la variación debida a los tratamientos es la suma de las diferencias al cua- 
drado entre la media de cada empleado y la media global. Este término es 992. Para calcular- 
lo, primero se encuentra la media de cada uno de los tres tratamientos. La media de Wolfe es 
56, determinada por (55 + 54 + 59 + 56)/4. Las otras medias son 70 y 48, respectivamente. 
La suma de los cuadrados debida a los tratamientos es: 

(56 - 58) 2 + (56 - 58) 2 + ■ ■ ■ + (48 - 58) 2 = 4(56 - 58) 2 + 4(70 - 58) 2 + 4(48 - 58) 2 

= 992 

Si existe una variación considerable entre las medias de los tratamientos, es lógico que este 
término sea grande. Si las medias son similares, este término será un valor bajo. El valor más 
bajo posible es cero. Esto ocurrirá cuando todas las medias de los tratamientos sean iguales. 

A la otra fuente de variación se le conoce como componente aleatoria, o componente de 
error. 


VARIACIÓN ALEATORIA Suma de las diferencias entre cada observación y su media de trata- 
miento elevadas al cuadrado. 


En el ejemplo, este término es la suma de las diferencias al cuadrado entre cada valor y la 
media de ese empleado en particular. La variación de error es 90. 

(55 - 56) 2 + (54 - 56) 2 + ■ ■ ■ + (48 - 48) 2 = 90 

El estadístico de prueba, que es la razón de las dos estimaciones de la varianza poblacio- 
nal, se determina a partir de la siguiente ecuación: 

Estimación de la varianza poblacional basada 
en las diferencias entre las medias muéstrales 
Estimación de la varianza poblacional basada 
en la variación dentro de la muestra 


La primera estimación de la varianza poblacional parte de los tratamientos, es decir, de la 
diferencia entre las medias. Éste es 992/2. ¿Por qué se dividió entre 2? Recuerde del capítu- 
lo 3 que, para encontrar una varianza muestral [vea la fórmula (3-11)], se divide entre el núme- 
ro de observaciones menos uno. En este caso hay tres tratamientos, por lo que se divide entre 
2. La primera estimación de la varianza poblacional es 992/2. 

La estimación de la varianza dentro de los tratamientos es la variación aleatoria dividía 
entre el número total de observaciones menos el número de tratamiento. Es decir 90/(12 - 3). 
De aquí, la segunda estimación de la varianza poblacional es 90/9. En realidad es una gene- 
ralización de la fórmula (11-5), en la cual se agruparon las varianzas muéstrales de dos pobla- 
ciones. 

El paso final es tomar la razón de estas dos estimaciones. 


992/2 

90/9 


49.6 


Como esta razón es muy distinta a 1 , se concluye que las medias de los tratamientos no son 
iguales. Hay una diferencia entre los números medios de clientes atendidos por cada uno de 
los tres empleados. 

A continuación se presenta otro ejemplo, el cual trata de muestras de tamaños diferentes. 
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Cjemplo 


Solución 


Desde hace algún tiempo las aerolíneas han reducido sus servicios, como alimentos y bocadi- 
llos durante sus vuelos, y empezaron a cobrar un precio adicional por algunos de ellos, como 
llevar sobrepeso de equipaje, cambios de vuelo de último momento y por mascotas que via- 
jan en la cabina. Sin embargo, aún están muy preocupadas por el servicio que ofrecen. Hace 
poco un grupo de cuatro aerolíneas contrató a Brunner Marketing Research, Inc., para encues- 
tar a sus pasajeros sobre la adquisición de boletos, abordaje, servicio durante el vuelo, mane- 
jo del equipaje, comunicación del piloto, etc. Hicieron 25 preguntas con diversas respuestas 
posibles: excelente, bueno, regular o deficiente. Una respuesta de excelente tiene una califica- 
ción de 4, bueno 3, regular 2 y deficiente 1 . Estas respuestas se sumaron, de modo que la cali- 
ficación final fue una indicación de la satisfacción con el vuelo. Entre mayor la calificación, 
mayor el nivel de satisfacción con el servicio. La calificación mayor posible fue 100. 

Brunner seleccionó y estudió al azar pasajeros de las cuatro aerolíneas. A continuación se 
muestra la información. ¿Hay alguna diferencia entre los niveles de satisfacción medios con 
respecto a las cuatro aerolíneas? Use el nivel de significancia de 0.01 . 


Northern 
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94 

75 

70 

68 

90 

68 

73 

70 

85 
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80 

83 

78 
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88 

80 
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68 

65 



65 



Utilice el procedimiento de prueba de hipótesis de cinco pasos. 

Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula es que las calificacio- 
nes medias de las cuatro aerolíneas son iguales. 

H 0 : tu = |x 2 = p 3 = p-4 

La hipótesis alternativa es que no todas las calificaciones medias son iguales. 

H-¡: No todas las calificaciones medias son iguales. 

La hipótesis alternativa también se considera como “al menos dos calificaciones 
medias no son iguales”. 

Si no se rechaza la hipótesis nula, se concluye que no hay una diferencia 
entre las calificaciones medias de las cuatro aerolíneas. Si se rechaza H 0 , se con- 
cluye que hay una diferencia en al menos un par de calificaciones medias, pero 
en este punto no se sabe cuál par o cuántos pares difieren. 

Paso 2: Seleccione el nivel de significancia. Seleccionó el nivel de significancia de 0.01 . 

Paso 3: Determine el estadístico de prueba. El estadístico de prueba sigue la distribu- 
ción F. 

Paso 4: Formule la regla de decisión. Para determinar la regla de decisión, necesita el 
valor crítico. El valor crítico del estadístico F aparece en el apéndice B.4. Los va- 
lores críticos del nivel de significancia 0.05 se encuentran en la primera página, y 
el nivel de significancia de 0.01 , en la segunda. Para utilizar esta tabla necesita 
conocer los grados de libertad del numerador y del denominador. Los grados de 
libertad del numerador son iguales al número de tratamientos, designado k, 
menos 1 . Los grados de libertad del denominador son el número total de obser- 
vaciones, n, menos el número de tratamientos. En este ejemplo hay cuatro trata- 
mientos y un total de 22 observaciones. 

Grados de libertad del numerador = k - 1 = 4-1 = 3 

Grados de libertad del denominador = n- /c = 22-4 = 18 
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OA4 Organizar datos en 
una tabla ANOVA para su 
análisis. 


Consulte el apéndice B.4 y el nivel de significancia de 0.01. Muévase horizontal- 
mente por la parte superior de la página a tres grados de libertad del numerador. 
Después vaya hacia abajo por esa columna hasta la fila con 18 grados de liber- 
tad. El valor en esta intersección es 5.09. Por lo tanto, la regla de decisión es 
rechazar H 0 si el valor calculado de F es mayor que 5.09. 

Paso 5: Seleccione la muestra, realice los cálculos y tome una decisión. Es convenien- 
te resumir los cálculos del estadístico F en una tabla ANOVA. El formato de una 
tabla ANOVA es como sigue. En los paquetes de software estadístico también se 
emplea este formato. 


Tabla ANOVA 

Fuente de variación 

Suma de cuadrados 

Grados de libertad 

Media cuadrática 

F 

Tratamientos 

SST 

k - 1 

SST/(/c — 1) = MST 

MST/MSE 

Error 

SSE 

n - k 

SSE/(n - k) = MSE 


Total 

SS total 

n - 1 




Hay tres valores, o suma de cuadrados, para calcular el estadístico de prueba F. Estos 
valores se determinan al obtener SS total y SSE, después SST mediante una resta. El término 
SS total es la variación total, SST es la variación debida a los tratamientos, y SSE es la varia- 
ción dentro de los tratamientos o el error aleatorio. 

En general, el proceso se inicia al determinar SST total: la suma de las diferencias eleva- 
das al cuadrado entre cada observación y la media global. La fórmula para determinar SS total 
es: 

SS total = 2(X — X G ) 2 (12-2) 

donde: 

_X es cada observación de la muestra. 

X Q es la media global o total. 

En seguida se determina SSE o la suma de los errores elevados al cuadrado: la suma de 
las diferencias elevadas al cuadrado entre cada observación y su respectiva media de trata- 
miento. La fórmula para encontrar SSE es: 

SSE = 2(X - X c f (12-3) 

donde: 

X c es la media muestral del tratamiento c. 

A continuación se presentan los cálculos detallados de SS total y SSE de este ejemplo. 
Para determinar los valores de SS total y SSE se comienza por calcular la media global o total. 
Hay 22 observaciones y el total es 1 664, por lo cual la media total es 75.64. 
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WTA 

Pocono 

Branson 

Total 


94 

75 

70 

68 
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76 
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80 

83 
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80 
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68 

65 





65 



Total de 

la columna 

349 

391 

510 

414 

1 664 

n 

4 

5 

7 

6 

22 

Media 

87.25 

78.20 

72.86 

69.00 

75.64 
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Luego se encuentra la desviación de cada observación a la media total: se elevan al 
cuadrado estas desviaciones y se suma el resultado de las 22 observaciones. Por ejemplo, 
el primer pasajero encuestado tenía una calificación de 94, y la media global o total es 
75.64. Por lo tanto, (X - X G ) = 94 - 75.64 = 18.36. En el caso del último pasajero, (X - X G ) 
= 65 - 75.64 = -10.64. Los cálculos relativos a los otros pasajeros son: 


Northern 

WTA 

Pocono 

Branson 

18.36 

-0.64 

-5.64 

-7.64 

14.36 

-7.64 

-2.64 

-5.64 

9.36 

1.36 

0.36 

-3.64 

4.36 

7.36 

2.36 

-10.64 


12.36 

4.36 

-1.64 



-7.64 

-10.64 



-10.64 



Después se eleva al cuadrado cada una de estas diferencias y se suman todos los valores. Así, 
en el caso del primer pasajero: 

(X - X G ) 2 = (94 - 75. 64) 2 = (18.36) 2 = 337.09 

Por último, se suman todas las diferencias elevadas al cuadrado, como se indica en la fórmu- 
la (12-2). El valor SS total es 1 485.10. 


Northern 

WTA 

Pocono 

Branson 

Total 

337.09 

0.41 

31.81 

58.37 


206.21 

58.37 

6.97 

31.81 


87.61 

1.85 

0.13 

13.25 


19.01 

54.17 

5.57 

113.21 



152.77 

19.01 

2.69 




58.37 

113.21 




113.21 



Total 649.92 

267.57 

235.07 

332.54 

1 485.10 


Para calcular el término SSE se encuentra la desviación entre cada observación y su media de 
tratamiento. En el ejemplo, la media del primer tratamiento (es decir, los pasajeros en Northern 
Airlines) es 87.25, determinada mediante X w = 349/4. El subíndice N se refiere a Northern Air- 
lines. 

El primer pasajero calificó a Northern con 94, por lo que (X - X N ) = (94 - 87.25) = 6.75. 
El primer pasajero del grupo de TWA respondió con una calificación total de 75, por lo cual 
(X — X w ) = (75 - 78.20) = —3.2. El detalle de todos los pasajeros es: 


Northern 

WTA 

Pocono 

Branson 

6.75 

-3.2 

-2.86 

-1 

2.75 

-10.2 

0.14 

1 

-2.25 

-1.2 

3.14 

3 

-7.25 

4.8 

5.14 

-4 


9.8 

7.14 

5 



-4.86 

-4 



-7.86 
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Estadística en acción 

¿Alguna vez ha estado 
esperando que se des- 
ocupe un teléfono pú- 
blico y la persona que 
lo usa pareciera hablar 
sin parar? Existe eviden- 
cia de que la gente 
habla más por un teléfo- 
no público cuando 
alguien está esperando 
que lo desocupe. En 
una encuesta reciente 
en un centro comercial, 
los investigadores midie- 
ron el tiempo que 56 
compradores pasaron 
hablando por teléfono: 

1) cuando estaban solos, 

2) cuando una persona 
estaba usando el teléfo- 
no de al lado y 3) cuan- 
do una persona estaba 
usando un teléfono de 
al lado y alguien espera- 
ba su turno. El estudio, 
que aplicó la técnica 
ANOVA de una vía, 
demostró que el tiempo 
medio de uso del teléfo- 
no era significativamen- 
te menor cuando la 
persona estaba sola. 


Cada uno de estos valores se eleva al cuadrado y después se suman las 22 observaciones. 
Los valores se muestran en la siguiente tabla. 


Northern 

WTA 

Pocono 

Branson 

Total 

45.5625 

10.24 

8.18 

1 


7.5625 

104.04 

0.02 

1 


5.0625 

1.44 

9.86 

9 


52.5625 

23.04 

26.42 

16 



96.04 

50.98 

25 




23.62 

16 




61.78 



Total 110.7500 

234.80 

180.86 

68 

594.41 


Por lo tanto, el valor SSE es 594.41 . Es decir, 2(X - X c ) 2 = 594.41 . 

Por último, se determina SST, la suma de los cuadrados debida a los tratamientos, con la 
resta: 


SST = SS total - SSE 


(12-4) 


En este ejemplo: 


SST = SS total - SSE = 1 485.10 - 594.41 = 890.69 

Para determinar el valor calculado de F, consulte la tabla ANOVA. Los grados de libertad del 
numerador y del denominador son los mismos que en el paso 4 en la página 420, donde se 
determinó el valor crítico de F. El término media cuadrática es otra expresión de la estimación 
de la varianza. La media cuadrática de tratamientos es SST dividido entre sus grados de liber- 
tad. El resultado es la media cuadrática de tratamientos, y se escribe MST. Calcule el error 
medio cuadrático de una manera similar. Para ser precisos, divida SSE entre sus grados de 
libertad. Para completar el proceso y obtener F, divida MST entre MSE. 

Sustituya los valores particulares de F en una tabla ANOVA y calcule el valor de F, como 
se muestra a continuación. 


Fuente de variación 

Suma de cuadrados 

Grados de libertad 

Media cuadrática 

F 

Tratamientos 

890.69 

3 

296.90 

8.99 

Error 

594.41 

18 

33.02 


Total 

1 485.10 

21 




El valor calculado de F es 8.99, mayor que el valor crítico de 5.09, por lo que la hipótesis 
nula se rechaza. La conclusión es que no todas las medias poblacionales son iguales. Las cali- 
ficaciones medias de las cuatro aerolíneas no son iguales. Es probable que las calificaciones 
de los pasajeros se relacionen con una de ellas. En este punto sólo es posible concluir que hay 
una diferencia entre las medias del tratamiento. No se puede determinar cuáles ni cuántos gru- 
pos de tratamientos difieren. 


Como se hizo notar en el ejemplo previo, los cálculos son tediosos si la cantidad de obser- 
vaciones en cada tratamiento es extensa. Hay muchos paquetes de software para generar 
estos resultados. A continuación se presenta la captura de pantalla de Excel en forma de una 
tabla ANOVA para el ejemplo anterior, con las calificaciones de aerolíneas y de pasajeros. 
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Existen algunas diferencias sutiles entre la captura de pantalla y los cálculos anteriores. Estas 
diferencias se deben al redondeo. 
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Observe que en Excel se emplea el término “Between Groups” (Entre grupos) para “Tra- 
tamientos”, y “Within Groups” (Dentro de grupos) para “Error”. Sin embargo, tienen el mismo 
significado. El valor p es 0.0007. Ésta es la probabilidad de determinar un valor del estadísti- 
co de prueba de esta magnitud o mayor cuando la hipótesis nula es verdadera. En otras pala- 
bras, es la probabilidad de calcular un valor F mayor que 8.99 con 3 grados de libertad en el 
numerador y 1 8 grados de libertad en el denominador. Por lo tanto, cuando se rechaza la hipó- 
tesis nula en este caso hay una posibilidad muy remota de cometer un error tipo I. 

En seguida se presenta la captura de pantalla de Minitab del ejemplo de las calificaciones 
de los pasajeros de aerolíneas, similar a la captura de pantalla de Excel. La salida también está 
en la forma de una tabla ANOVA. Además, Minitab proporciona información sobre las diferen- 
cias entre medias. Esto se analiza en la siguiente sección. 


12 \ ANOVA MTB.MPJ 1 

Results for: Worksheet 3 

One-way ANOVA: Northern, WTA, Pocono, Branson 

Source DF SS MS F P 

Factor 3 890.7 296.9 8.99 0.001 

Error 18 594.4 33.0 

Total 21 1485.1 

S = 5.747 R-Sq = 59.98% R-Sq(adj) = 53.30% 


0®® 


Individual 95% CIs For Mean Based on Pooled StDev 


Level 

Northern 

WTA 

Pocono 

Branson 


Mean 

87.250 

78.200 

72.857 

69.000 


StDev 

6.076 

7.662 

5.490 

3.688 


4 

C1 

C2 

C3 

C4 


Northern 

WTA 

Pocono 

Branson 

1 

94 

75 

70 

68 

2 

90 

68 

73 

70 

3 

85 

77 

76 

72 

4 

80 

83 

78 

65 

5 


88 

80 

74 

6 



68 

65 

7 


65 


< 1! 




> 


Pooled StDev = 5.747 


En el sistema Minitab se emplea el término “Factor” en lugar de tratamiento , con el mismo 
significado. 
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Citrus Clean es un nuevo limpiador multiusos a prueba en el mercado, del cual se han colocado 
exhibidores en tres lugares distintos dentro de varios supermercados. A continuación se reporta la 
cantidad de botellas de 12 onzas que se vendieron en cada lugar del supermercado. 


Cerca del pan 

18 

14 

19 

17 

Cerca de la cerveza 

12 

18 

10 

16 

Cerca de otros limpiadores 

26 

28 

30 

32 


A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los promedios de botellas que se 
vendieron en los tres lugares? 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Calcule los valores de SS total, SST y SSE. 

d) Elabore una tabla ANOVA. 

e) ¿Cuál es su decisión respecto de la hipótesis nula? 


comed: 


Ejercicios 

7. La siguiente es Información muestral. Verifique la hipótesis de que las medias de tratamiento son 
iguales. Utilice el nivel de significancia de 0.05. 



a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Calcule los valores SST, SSE y SS total. 

d) Elabore una tabla ANOVA. 

e) Declare su decisión respecto de la hipótesis nula. 

8. La siguiente es información muestral. Verifique la hipótesis con un nivel de significancia de 0.05 de 
que las medias de tratamiento son iguales. 


Tratamiento 1 

Tratamiento 2 

Tratamiento 3 

9 

13 

10 

7 

20 

9 

11 

14 

15 

9 

13 

14 

12 


15 

10 




a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Calcule SST, SSE y SS total. 

d) Elabore una tabla ANOVA. 

e) Declare su decisión respecto de la hipótesis nula. 
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OA6 Desarrollar intervalos 
de confianza de la diferencia 
entre medias de tratamiento 
e interpretar los resultados. 


9. Un inversionista en bienes raíces considera invertir en un centro comercial en los suburbios de 
Atlanta, Georgia, para lo cual evalúa tres terrenos. El ingreso familiar en el área circundante al cen- 
tro comercial propuesto tiene una importancia particular. Se selecciona una muestra aleatoria de 
cuatro familias cerca de cada centro comercial propuesto. A continuación se presentan los resul- 
tados de la muestra. A un nivel de significancia de 0.05, ¿el inversionista puede concluir que hay 
una diferencia entre los ingresos medios? Utilice el procedimiento de prueba de hipótesis habitual 
de cinco pasos. m 


Área de Southwyck 
(en miles de dólares) 

Franklin Park (en 
miles de dólares) 

Oíd Orchard (en 
miles de dólares) 

64 

74 

75 

68 

71 

80 

70 

69 

76 

60 

70 

78 


10. La gerente de una compañía de software desea estudiar el número de horas que los directivos de 
diversas empresas utilizan sus computadoras de escritorio. El gerente seleccionó una muestra 
de cinco ejecutivos de cada una de tres industrias. A un nivel de significancia de 0.05, ¿puede la 
gerente concluir que hay una diferencia entre los promedios de horas por semana que se utilizan 
las computadoras en la industria? m 


Bancaria 

Detallista 

De seguros 

12 

8 

10 

10 

8 

8 

10 

6 

6 

12 

8 

8 

10 

10 

10 


12.6 Tratamiento e inferencia 
sobre pares de medias 

Suponga que realiza el procedimiento ANOVA y toma la decisión de rechazar la hipótesis nula. 
Esto permite concluir que no todas las medias de tratamiento son ¡guales. Algunas veces esta 
conclusión sería satisfactoria, pero otras se desea conocer cuáles medias de tratamiento difie- 
ren. En esta sección se proporcionan los detalles de prueba para saber cuáles medias de tra- 
tamiento difieren. 

Recuerde que en el ejemplo de Brunner Research respecto de las calificaciones que apli- 
caron los pasajeros de aerolíneas, había una diferencia entre las medias de tratamiento. Es 
decir, se rechazó la hipótesis nula y se aceptó la hipótesis alternativa. Si las calificaciones 
de los pasajeros no difieren, la pregunta es: ¿entre qué grupos difieren las medias de trata- 
miento? 

Se dispone de vahos procedimientos para responder esta pregunta. El más simple es 
emplear intervalos de confianza, es decir, la fórmula (9-2). A partir de la captura de pantalla de 
la computadora del ejemplo anterior (consulte la página 424), observe que la calificación media 
muestral de los pasajeros del servicio de la aerolínea Northtern es 87.25, mientras la me- 
dia muestral de los que califican el servicio de la aerolínea Branson es 69.00. ¿Existe suficien- 
te disparidad para justificar la conclusión de que hay una diferencia significativa entre las 
calificaciones de satisfacción medias de las dos aerolíneas? 

La distribución f, descrita en los capítulos 10 y 11, sirve como base de esta prueba. 
Recuerde que una de las suposiciones de ANOVA es que las varlanzas poblacionales de todos 
los tratamientos son las mismas. Este valor común de la población es el error medio cuadrá- 
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tico, o MSE, y se determina mediante SSE/(n - k). Un intervalo de confianza de la diferencia 
entre dos poblaciones se obtiene mediante: 


INTERVALO DE CONFIANZA DE LA DIFERENCIA 
ENTRE LAS MEDIAS DE TRATAMIENTO 


(*i 


X 2 ) ± t 



(12-5) 


donde: 

X-i es la media de la primera muestra. 

X 2 es la media de la segunda muestra. 
t se obtiene del apéndice B.2. Los grados de libertad son iguales a n - k. 

MSE es el error medio cuadrático que se obtuvo de la tabla ANOVA [SSE/(n - k)\. 
n- 1 es el número de observaciones en la primera muestra. 
n 2 es el número de observaciones en la segunda muestra. 

¿Cómo se decide si hay una diferencia entre las medias de tratamiento? Si el intervalo de 
confianza incluye cero, no existe diferencia entre ellas. Por ejemplo, si el punto extremo 
izquierdo del intervalo de confianza tiene signo negativo y el punto extremo derecho tiene 
signo positivo, el intervalo incluye cero, y las dos medias no difieren. Por lo tanto, si se des- 
arrolla un intervalo de confianza a partir de la fórmula (12-5) y se tiene que la diferencia entre las 

medias muéstrales fue 5.00, es decir, si X, — X 2 = 5 y U / MSE( — + — ) = 12, el intervalo de 

V \n i n 2 J 

confianza variará de -7.00 hasta 17.00. Expresado en símbolos: 


(X 1 - X 2 ) ± tJ MSE — + — = 5.00 ± 12.00 = -7.00 hasta 17.00 


Observe que en este intervalo se incluye el cero. Por ello, se concluye que no hay una diferen- 
cia significativa entre las medias de tratamiento seleccionadas. 

Por otro lado, si los puntos extremos del intervalo de confianza tienen el mismo signo, 
esto indica que las medias de tratamiento difieren. Por ejemplo, si - X 2 = —0.35 y 


= 0.25, el intervalo de confianza variará de -0.60 hasta —0.10. Como 


f A / mse(— + — 

\n i n 2 

-0.60 y -0.10 tienen el mismo signo, ambos negativos, cero no se encuentra en el intervalo 
y se concluye que estas medias de tratamiento difieren. 

Use el ejemplo anterior sobre las aerolíneas para calcular el intervalo de confianza de la 
diferencia entre las calificaciones medias de los pasajeros de las aerolíneas Northern y 
Branson. Con un nivel de confianza de 95%, los puntos extremos del intervalo de confianza 
son 10.46 y 26.04. 


(X A ~ X us ) ± tJ MSE 


1 


1 

n us 


= (87.25 - 69.00) ± 2.101^33.0^ + ^ 
= 18.25 ± 7.79 


donde: 

X„ es 87.25. 

X us es 69.00 

t es 2.101 : del apéndice B.2 con (n - k) = 22 - 4 = 18 grados de libertad. 
MSE es 33.0: de la tabla ANOVA con SSE/(n - k) = 594.4/18. 

n E es 4. 
nus es 6. 


El intervalo de confianza de 95% varía de 1 0.46 hasta 26.04. Los dos puntos extremos son 
positivos; de aquí se puede concluir que estas medias de tratamiento difieren de manera sig- 



428 


CAPÍTULO 12 Análisis de la varianza 


Autoevaluación 12-3 



nificativa. Es decir, los pasajeros de Northern calificaron el servicio en gran medida diferente 
de los de Branson Airlines. 

También es posible obtener resultados aproximados de forma directa a partir de la captu- 
ra de pantalla de Minitab. A continuación se presenta la parte inferior de la captura de panta- 
lla que se muestra en la página 424. A la izquierda se encuentra el número de observaciones, 
la media y la desviación estándar de cada tratamiento. Siete pasajeros de Allegheny califica- 
ron su servicio con 72.857, con una desviación estándar de 5.490. 


Individual ').%* Cía Fnr tlrnn Haard nn Ponlrd StDcv 


Level 

H 

Hean 

Scíev 

t ♦ t + 

Huitiieui 

4 

87.250 

6.076 

( • ) 

UTA 

& 

711. ZOO 

7.663 

( » j 

Pneonn 

7 

72.8S7 

c .. 660 

< 

Branson 

6 

fft.t 1 : 

3.688 

( * ) 


04 . U 72.0 UU.O UU.U 


A la derecha de la impresión se encuentra un intervalo de confianza cada media de trata- 
miento. El asterisco (*) indica la ubicación de la media de tratamiento, y la apertura de parén- 
tesis a la izquierda y el cierre de paréntesis a la derecha, los puntos extremos del intervalo de 
confianza. En los casos donde se superponen los paréntesis, quizá no difieran las medias 
de tratamiento. Si no hay un área común en los intervalos de confianza, ese par de medias di- 
fiere. 

Los puntos extremos de un intervalo de confianza de 95% de las calificaciones de los 
pasajeros de la compañía Pocono son aproximadamente 69 y 77. Los puntos extremos del 
intervalo de confianza de 95% de la compañía Branson de la calificación media de los pasa- 
jeros son aproximadamente 64 y 73. Hay un área común entre estos puntos, por lo cual se 
concluye que este par de medias no difieren. En otras palabras, no hay una diferencia signifi- 
cativa entre las calificaciones medias de los pasajeros de las aerolíneas Pocono y Branson. La 
diferencia entre las calificaciones medias se debe a la casualidad. 

Hay dos pares de medias que difieren. Las calificaciones medias de los pasajeros de la 
aerolínea Northern difieren de manera significativa de las calificaciones medias de los pasaje- 
ros de las aerolíneas Pocono y Branson. No hay un área común entre estos pares de interva- 
los de confianza. 

Se debe destacar que esta investigación es un proceso que avanza por pasos. El paso ini- 
cial es realizar la prueba ANOVA. Sólo si se rechaza la hipótesis nula de que las medias de tra- 
tamiento son iguales se deberán analizar las medias de tratamiento individuales. 


Los siguientes datos son las colegiaturas por semestre (en miles de dólares) de una muestra de uni- 
versidades privadas en varias regiones de Estados Unidos. A un nivel de significancia de 0.05, ¿se 
puede concluir que hay una diferencia entre las colegiaturas medias de las diversas regiones? 


Noreste (en 
miles de dólares) 

Sureste (en 
miles de dólares) 

Oeste (en 
miles de dólares) 

10 

8 

7 

11 

9 

8 

12 

10 

6 

10 

8 

7 

12 


6 


a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Elabore una tabla ANOVA. ¿Cuál es el valor del estadístico de prueba? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

e) ¿Puede existir una diferencia significativa entre la colegiatura media en el noreste en compara- 
ción con la del oeste? Si la hay, desarrolle el intervalo de confianza de 95% de esa diferencia. 
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comect 


Ejercicios 

11. Con la siguiente información muestral, compruebe la hipótesis de que las medias de tratamiento 
son iguales con un nivel de significancia de 0.05. 


Tratamiento 1 

Tratamiento 2 

Tratamiento 3 

8 

3 

3 

11 

2 

4 

10 

1 

5 


3 

4 


2 



a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Calcule SST, SSE y SS total. 

d) Elabore una tabla ANOVA. 

e) Declare su decisión respecto de la hipótesis nula. 

f) Si se rechaza H 0 , ¿puede concluir que el tratamiento 1 y el 2 difieren? Utilice el nivel de con- 
fianza de 95%. 

12 . Con la siguiente información muestral, compruebe la hipótesis de que las medias de tratamiento 
son iguales con un nivel de significancia 0.05. 



a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? 

c) Calcule SST, SSE y SS total. 

d) Elabore una tabla ANOVA. 

e) Declare su decisión respecto de la hipótesis nula. 

f) Si rechaza H 0 , ¿puede concluir que el tratamiento 2 y el 3 difieren? Utilice el nivel de confian- 
za de 95%. 

13 . Una alumna en su último año en la carrera de contabilidad de la Midsouth State University tiene 
ofertas de trabajo de cuatro empresas de contabilidad pública. Para estudiar las ofertas a fondo, 
preguntó a una muestra de personas recién capacitadas cuántos meses trabajó cada una en la 
empresa antes de recibir un aumento salarial. La información muestral se corrió en Minitab con los 
siguientes resultados: 


Análisis 

de 

la varianza 




Fuente 

DF 

SS 

MS 

F 

P 

Factor 

3 

32.33 

10 . 78 

2.36 

0.133 

Error 

10 

45 . 67 

4 . 57 



Total 

13 

78 . 00 





A un nivel de significancia de 0.05, ¿hay una diferencia entre los números medios de meses antes 
de que las empresas de contabilidad otorgaran un aumento a sus empleados? 

14. Un analista de la bolsa de valores desea determinar si hay una diferencia entre las tasas de rendi- 
miento medias de tres tipos de acciones: de compañías de servicios, detallistas y bancarias. 
Obtuvo los siguientes resultados: 
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OA7 Realizar una prueba de 
hipótesis entre medias de 
tratamiento con una variable 
de bloqueo. 


Cjemplo 


Análisis de 

: la 

varianza 


Fuente 

DF 

SS 

MS 

Factor 

2 

86.49 

43.25 

Error 

13 

42 . 95 

3.30 

Total 

15 

129.44 




Desviación 




estándar 

Nivel 

N 

Media 

conjunta 

Servicios 

5 

17.400 

1 . 916 

Detallistas 

5 

11 . 620 

0.356 

Bancarios 

6 

15.400 

2.356 


Desviación estándar = 1.818 


F P 

13.09 0.001 


Intervalos de confianza de 95% para 
las medias con base en la desviación 
estándar conjunta 

+ + + 

( * ) 

( * ) 

( * ) 


12.0 15.0 18.0 


a) A un nivel de significancia de 0.05, ¿hay alguna diferencia entre las tasas de recuperación 
medias de los tres tipos de acciones? 

b) Suponga que se rechaza la hipótesis nula. ¿Puede el analista concluir que hay una diferencia 
entre las tasas medias de rendimiento de las acciones de servicios y de detallistas? Explique. 

12.7 Análisis de la varianza de dos vías 

En el ejemplo de las calificaciones de los pasajeros de aerolíneas, la variación total se dividió 
en dos categorías: la variación entre los tratamientos y la variación dentro de los tratamientos. 
También se denominó la variación dentro de los tratamientos como error o variación aleatoria. 
En otras palabras, sólo se consideraron dos fuentes de variación, la debida a los tratamientos 
y a las diferencias aleatorias. En el ejemplo de las calificaciones de los pasajeros de aerolí- 
neas puede haber otras causas de variación. Estos factores pueden incluir, por ejemplo, la 
estación del año, el aeropuerto o el número de pasajeros en el vuelo. 

El beneficio al considerar otros factores es que se reduce la varianza del error. Es decir, si 
se reduce el denominador del estadístico F (al reducir la varianza del error o, de manera más 
directa, el término SSE), el valor de F será mayor, lo que ocasionará el rechazo de la hipótesis 
del tratamiento de medias ¡guales. En otras palabras, si se puede explicar más la variación, 
habrá menos “error”. Un ejemplo aclarará la reducción de la varianza del error. 



El director de WARTA, Warren Area Transit Autho- 
rity, considera ampliar el servicio de autobuses 
del suburbio de Starbrick al distrito comercial 
central de Warren. Se consideran cuatro rutas de 
Starbrick al centro de Warren: 1) por la carretera 
6, 2) por el West End, 3) por Hickory Street Bridge, 
y 4) por la ruta 59. El director realizó varias prue- 
bas para determinar si había una diferencia entre 
los tiempos de recorrido medios por las cuatro 
rutas. Como habrá muchos conductores distin- 
tos, la prueba se diseñó para que cada conductor 
manejara a lo largo de todas ellas. A continuación se presenta el tiempo del recorrido, en minu- 
tos, de cada combinación conductor-ruta. 


Conductor 

Tiempo de recorrido de Starbrick a Warren (minutos) 

Carretera 6 

West End 

Hickory St. 

Ruta 59 

Deans 

18 

17 

21 

22 

Snaverly 

16 

23 

23 

22 

Ormson 

21 

21 

26 

22 

Zollaco 

23 

22 

29 

25 

Filbeck 

25 

24 

28 

28 
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Solución 


A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los tiempos de recorrido 
medios a lo largo de las cuatro rutas? Si elimina el efecto de los conductores, ¿hay alguna dife- 
rencia entre los tiempos de recorrido medios? 

Para iniciar, realice una prueba de hipótesis con ANOVA de una vía. Es decir, sólo considere las 
cuatro rutas. Con esta condición, la variación entre los tiempos del recorrido se debe a los tra- 
tamientos o es aleatoria. La hipótesis nula y la alternativa para comparar los tiempos de reco- 
rrido medios por las cuatro rutas son: 

H 0 - Al = P2 = P3 = P4 

No todas las medias de tratamiento son iguales. 

Hay cuatro rutas, por lo cual los grados de libertad del numerador son k — 1 = 4-1 =3. Hay 
20 observaciones. Por consiguiente, los grados de libertad del denominador son n - k = 20 - 
4 = 16. Del apéndice B.4, con el nivel de significancia de 0.05, el valor crítico de Fes 3.24. La 
regla de decisión es rechazar la hipótesis nula si el valor calculado de F es mayor que 3.24. 

Para realizar los cálculos emplee Excel. El valor calculado de F es 2.482, por lo que la deci- 
sión es no rechazar la hipótesis nula. Concluye que no hay una diferencia entre los tiempos de 
recorrido medios a lo largo de las cuatro rutas. No hay una razón para seleccionar una de las 
rutas como más rápida que las demás. 



De la captura de pantalla de Excel anterior, los tiempos de recorrido medios a lo largo de 
las rutas fueron: 20.6 minutos por la carretera 6, 21.4 minutos por la West End, 25.4 minutos 
por Hickory Street y 23.8 minutos por la ruta 59. Se concluye que es razonable atribuir estas 
diferencias a la casualidad. De la tabla ANOVA se observa que: SST es 72.8, SSE es 156.4 y 
SS total es 229.2. 


En el ejemplo anterior se consideró la variación debida a los tratamientos (rutas) y se tomó 
toda variación restante como aleatoria. Si se pudiera considerar el efecto de los diversos con- 
ductores, se podría reducir el término SSE, lo cual generaría un valor mayor de F. A la segun- 
da variable de tratamiento, en este caso los conductores, se le conoce como variable de blo- 
queo. 


VARIABLE DE BLOQUEO Una segunda variable de tratamiento que, cuando se incluye en el 
análisis ANOVA, tendrá el efecto de reducir el término SSE. 
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En este caso, los conductores son la variable de bloqueo, y al eliminar el efecto de los con- 
ductores del término SSE cambiará la razón F de la variable de tratamiento. Primero, es nece- 
sario determinar la suma de los cuadrados debida a los bloques. 

En una ANOVA de dos vías, la suma de los cuadrados debida a los bloques se determina 
mediante la siguiente fórmula. 


SSB = kZ(X b - X G f 


( 12 - 6 ) 


donde: 

k es el número de tratamientos. 
b es el número de bloqueos. 

X b es la media muestral del bloque b. 

X G es la media global o total. 

A partir de los siguientes cálculos, las medias de los conductores respectivos son 19.5 minu- 
tos, 21 minutos, 22.5 minutos, 24.75 minutos y 26.25 minutos. La media global es 22.8 minu- 
tos, determinada por la suma del tiempo de recorrido de los 20 conductores (456 minutos) y 
su división entre 20. 


Tiempo de recorrido de Starbrick a Warren (minutos) 

Conductor Carretera 6 

West End 

Hickory St. 

Ruta 59 

Sumas de los 
conductores 

Medias de los 
conductores 

Deans 

18 

17 

21 

22 

78 

19.5 

Snaverly 

16 

23 

23 

22 

84 

21 

Ormson 

21 

21 

26 

22 

90 

22.5 

Zollaco 

23 

22 

29 

25 

99 

24.75 

Filbeck 

25 

24 

28 

28 

105 

26.25 


Al sustituir esta información en la fórmula (12.6), se determina SSB, y la suma de los cuadra- 
dos debida a los conductores (la variable de bloqueo) es 119.7. 

SSB = k2(X b - X G ) 2 

= 4(19.5 - 22. 8) 2 + 4(21.0 - 22. 8) 2 + 4(22.5 - 22.8) 2 
+ 4(24.75 - 22. 8) 2 + 4(26.25 - 22.8) 2 
= 119.7 

Se utiliza el mismo formato en la tabla ANOVA de dos vías, como en el caso de una vía, 
excepto que hay una fila adicional para la variable de bloqueo. SS total y SST se calculan 
como se hizo antes, y SSB se determina con la fórmula (12-6). El término SSE se calcula 
mediante una resta. 


O 


SUMA DE ERRORES CUADRATICOS, DOS VIAS 


SSE = SS total - SST - SSB 


(12 


* 


Los valores de los varios componentes de la tabla ANOVA se calculan como sigue. 


Fuente de 
variación 

Suma de los 
cuadrados 

Grados de libertad 

Media cuadrática 

F 

Tratamientos 

SST 

k- 1 

SST /(k - 1) = MST 

MST/MSE 

Bloques 

SSB 

b- 1 

SSB /(b- 1) = MSB 

MSB/MSE 

Error 

SSE 

(k - 1)(f> - 1) 

SSE/(/r - 1)(ó — 1) = MSE 


Total 

SS total 

n - 1 
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SSE se obtiene con la fórmula (12-7). 

SSE = SS total - SST - SSB = 229.2 - 72.8 - 119.7 = 36.7 


Fuente de 
variación 

(1) 

Suma de los 
cuadrados 

(2) 

Grados de 
libertad 

(3) 

Media cuadrática 
(1)/(2) 

Tratamientos 

72.8 

3 

24.27 

Bloques 

119.7 

4 

29.93 

Error 

36.7 

12 

3.06 

Total 

229.2 

19 



En este punto hay un desacuerdo. Si el objetivo de la variable de bloqueo (los conducto- 
res en este ejemplo) fue sólo reducir la variación del error, no se debe realizar una prueba de 
hipótesis de las diferencias entre las medias de los bloques. Es decir, si el objetivo era reducir 
el término MSE, no se debe probar una hipótesis respecto de la variable de bloqueo. Por otro 
lado, quizá se desee dar a los bloques la misma condición que a los tratamientos y realizar una 
prueba de hipótesis. Este último caso, cuando los bloques son lo bastante importantes para 
considerarse un segundo factor, se conoce como un experimento de dos factores. En 
muchos casos, la decisión no es clara. En este ejemplo lo importante es la diferencia entre los 
tiempos de recorrido de los diversos conductores, por lo que se realizará la prueba de hipóte- 
sis. Los dos conjuntos de hipótesis son: 

1. H 0 : Las medias de tratamiento son iguales (|x-, = |x 2 = |x 3 = |x 4 ). 

H-¡ : Las medias de tratamiento no son iguales. 

2. H 0 : Las medias de los bloques son iguales (|jl 1 = |x 2 = |x 3 = (jl 4 = Ps)- 
H-¡ : Los medias de los bloques no son iguales. 

Primero se pondrá a prueba la hipótesis respecto de las medias de tratamiento. Hay k - 1 
= 4-1 =3 grados de libertad en el numerador y (b - 1 )(k- 1) = (5 - 1)(4 - 1) = 12 grados de 
libertad en el denominador. Con el nivel de significancia de 0.05, el valor crítico de F es 3.49. 
La hipótesis nula de que los tiempos medios para las cuatro rutas son iguales se rechaza si la 
razón F es mayor que 3.49. 


MST _ 24.27 
MSE ~~ 3.06 


7.93 


La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que el tiempo de 
recorrido medio no es el mismo para todas las rutas. Sería recomendable que WARTA realiza- 
ra algunas pruebas para determinar cuáles medias de tratamiento difieren. 

En seguida se prueba si el tiempo de recorrido es el mismo para los diversos conducto- 
res. Los grados de libertad en el numerador para los bloques son ¿> - 1 = 5-1 =4. Los gra- 
dos de libertad para el denominador son los mismos que antes: ( b - 1)(/c — 1) = (5 - 1)(4 - 1) 
= 12. La hipótesis nula de que las medias de los bloques son iguales se rechaza si la razón F 
es mayor que 3.26. 


MSB _ 29.93 
MSE ~~ 3.06 


9.78 


Se rechaza la hipótesis nula y se acepta la hipótesis alternativa. El tiempo medio no es el 
mismo para los conductores. Así, la gerencia de WARTA puede concluir, con base en los resul- 
tados de la muestra, que hay una diferencia en las rutas y en los conductores. 

La hoja de cálculo de Excel tiene un procedimiento ANOVA de dos factores. A continua- 
ción se presenta la captura de pantalla del ejemplo WARTA recién terminado. Los resultados 
son los mismos que los anteriores. Además, en la captura de pantalla de Excel se reportan los 
valores p. El valor p de la hipótesis nula respecto de los conductores es 0.001, y 0.004 para 
las rutas. Estos valores p confirman que las hipótesis nula de tratamientos y bloques se debe- 
rán rechazar debido a que el valor p es menor que el nivel de significancia. 
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Rudduck Shampoo vende tres tipos de champúes: para cabello seco, normal y graso. En la tabla 
siguiente se presentan las ventas, en millones de dólares, de los últimos cinco meses. Con un nivel 
de significancia de 0.05, compruebe si las ventas medias difieren entre los tres tipos de champúes 
o según el mes. 


Mes 

Ventas (millones de dólares) 

Seco 

Normal 

Graso 

Junio 

7 

9 

12 

Julio 

11 

12 

14 

Agosto 

13 

11 

8 

Septiembre 

8 

9 

7 

Octubre 

9 

10 

13 


comect 


Ejercicios 

En los ejemplos 15 y 16 realice una prueba de hipótesis para determinar si difieren las medias de blo- 
queo o de tratamiento. Con un nivel de significancia de 0.05: a) formule las hipótesis nula y alternativa 
para los tratamientos, b) establezca la regla de decisión para los tratamientos y c) formule las hipótesis 
nula y alternativa para los bloques. También establezca la regla de decisión para los bloques, d) calcu- 
le SST, SSB, SS total y SSE, e) elabore una tabla ANOVA y f ) indique su decisión respecto de los dos 
conjuntos de hipótesis. 

15. Los siguientes datos corresponden a una prueba ANOVA de dos factores. 


Bloque 

Tratamiento 

1 2 

A 

46 

31 

B 

37 

26 

C 

44 

35 
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OA8 Realizar una ANOVA 
de dos vías con interacción y 
describir los resultados. 


16. Los siguientes datos corresponden a una prueba ANOVA de dos factores. 


Bloque 

Tratamiento 

1 

2 

3 

A 

12 

14 

8 

B 

9 

11 

9 

C 

7 

8 

8 


17. Chapín Manufacturing Company opera 24 horas al día, 5 días a la semana. Los trabajadores alter- 
nan turnos cada semana. La gerencia desea saber si hay una diferencia entre los números de uni- 
dades producidas por los empleados que trabajan en diversos turnos. Se selecciona una muestra 
de cinco trabajadores y se registran las unidades producidas en cada tumo. A un nivel de signifi- 
cancia de 0.05, ¿puede concluir que hay una diferencia entre las tasas de producción medias por 
turno o por empleado? m 


Empleado 


Unidades producidas 


Matutino 

Vespertino 

Nocturno 

Skaff 

31 

25 

35 

Lum 

33 

26 

33 

Clark 

28 

24 

30 

Treece 

30 

29 

28 

Morgan 

28 

26 

27 


18. En el área de Tulsa, Oklahoma, hay tres hospitales. Los siguientes datos muestran el número de 
cirugías realizadas a pacientes externos en cada uno de ellos durante la semana pasada. A un nivel 
de significancia de 0.05, ¿puede concluir que hay una diferencia entre los números medios de ciru- 
gías realizadas por cada hospital o por día de la semana? m 


Dia 

Número de cirugías realizadas 

St. Luke’s 

St. Vincent 

Mercy 

Lunes 

14 

18 

24 

Martes 

20 

24 

14 

Miércoles 

16 

22 

14 

Jueves 

18 

20 

22 

Viernes 

20 

28 

24 


12.8 ANOVA de dos vías con interacción 

En la sección anterior se estudiaron los efectos separados o Independientes de dos variables, 
rutas hacia la ciudad y conductores, respecto a los tiempos de recorrido medios. Los resulta- 
dos muéstrales indicaron distintos tiempos medios según las rutas. Quizás esto tan sólo se 
relacione con diferencias entre la distancia por las rutas. Los resultados también Indicaron di- 
ferencias entre los tiempos de conducción medios de los diversos conductores. Tal vez esta 
diferencia se explique al diferenciar las velocidades promedio de los conductores, sin Impor- 
tar la ruta. Existe otro efecto que influye en el tiempo de recorrido. A éste se le denomina efec- 
to de interacción entre la ruta y el conductor sobre el tiempo de recorrido. Por ejemplo, ¿es 
posible que uno de los conductores sea especialmente bueno conduciendo por una o más de 
las rutas? Tal vez un conductor sabe cronometrar con eficacia los semáforos o cómo evitar 
intersecciones muy congestionadas en una o más rutas. En este caso, el efecto combinado 
del conductor y la ruta también explica las diferencias entre los tiempos de recorrido medios. 
Para medir los efectos de interacción es necesario tener al menos dos observaciones en cada 
celda. 
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Cuando se emplea ANOVA de dos vías para estudiar la interacción, en lugar de emplear 
los términos tratamientos y bloques, ahora a las dos variables se les denominan factores. Por 
lo tanto, en este método hay un factor, la ruta, y otro factor, el conductor, además de la inter- 
acción entre ambos factores. Es decir, hay un efecto de las rutas, del conductor y de la in- 
teracción entre conductores y rutas. 

La interacción tiene lugar si la combinación de dos factores ejerce algún efecto sobre la 
variable en estudio, además de hacerlo en cada factor por sí mismo. A la variable en estudio 
se le llama variable de respuesta. Un ejemplo cotidiano de interacción es el efecto de dieta y 
ejercicio sobre el peso. En general, se acepta que el peso de una persona (la variable de res- 
puesta) se controla mediante dos factores, dieta y ejercicio. Las investigaciones demuestran 
que una dieta, por sí sola, afecta al peso de una persona, y también que el solo ejercicio tiene 
un efecto sobre el peso. Sin embargo, el método recomendado para controlar el peso se fun- 
damenta en el efecto combinado o en la interacción entre dieta y ejercicio. 


INTERACCIÓN El efecto de un factor sobre una variable de respuesta difiere según el valor de 
otro factor. 

V / 


Gráficas de interacción 

Una manera de estudiar la interacción es al graficar medias de factores en una gráfica deno- 
minada de interacción. Considere el ejemplo del conductor de autobús de la sección anterior. 
La gerencia de WARTA, Warren Area Regional Translt Authorlty, desea estudiar el tiempo de 
recorrido medio de rutas y conductores distintos. Para completar el estudio, también debe 
explorar la posible interacción entre el conductor y la ruta. El trazo de la gráfica se Inicia con 
la colocación de los puntos que representan los tiempos de recorrido medios de cada ruta por 
cada conductor y la conexión de tales puntos. Se calculan los tiempos de recorrido medios de 
Deans por cada ruta y se trazan en una gráfica de tiempos de recorrido medios contra la ruta. 
Este proceso se repite con cada conductor. La siguiente es la gráfica de Interacción. 



Con esta gráfica se comprende mejor la interacción entre los efectos de los conductores y las 
rutas sobre el tiempo de recorrido. Si los segmentos de recta de los conductores son casi 
paralelos, tal vez no haya interacción. Por otro lado, si los segmentos de recta no parecen ser 
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paralelos o se cruzan, esto sugiere una interacción entre los factores. En la gráfica anterior se 
sugiere una interacción porque: 

• Los segmentos de recta de Zollaco y Filbeck se cruzan entre sí. 

• El segmento de recta de Snaverly de la carretera 6 a West End cruza tres segmentos de 
recta. 

Estas observaciones sugieren una interacción entre el conductor y la ruta. 


Prueba de hipótesis para detectar interacción 

El siguiente paso es realizar pruebas estadísticas para investigar aún más los efectos de inter- 
acciones posibles. En resumen, el estudio de los tiempos de recorrido plantea varias pre- 
guntas: 

• ¿Flay alguna interacción entre rutas y conductores? 

• ¿Los tiempos de recorrido de los conductores son iguales? 

• ¿Los tiempos de recorrido de las rutas son ¡guales? 

De las tres preguntas, la de mayor interés es sobre la prueba de interacciones. 

Estas preguntas se investigan en forma estadística al ampliar el procedimiento ANOVA de 
dos vías de la sección anterior. Hay que agregar otra fuente de variación, la interacción. Sin 
embargo, a fin de estimar la suma de “error” de los cuadrados, son necesarias al menos dos 
mediciones para cada combinación conductor/ruta. Por ello, suponga que se repite el experi- 
mento de la página 430 con la medición de dos o más tiempos de recorrido de cada combi- 
nación conductor/ruta. Entonces, se replica el experimento. Ahora hay tres observaciones por 
cada combinación de conductor/ruta. Con la media de tres tiempos de recorrido por cada 
combinación se obtiene una medida más confiable del tiempo de recorrido medio. Los resul- 
tados de la duplicación del experimento aparecen en la siguiente tabla de Excel. Observe que, 
para poder emplear este software estadístico, los datos deben ingresar exactamente en este 
formato. 


fiJTwo Way Anova with Interactions 


A 

B 

C 

0 

E 

F 

G 

1 






2 


US 6 

WettEnd 

Htckory St 

RowteS9 


3 

0**nj 

18 

14 

20 

19 


4 

Deanj 

15 

17 

21 

22 


5 

Deanj 

21 

20 

22 

25 


6 

Snaverty 

19 

20 

24 

24 


7 

Snaverty 

15 

24 

23 

22 


8 

Snaverty 

14 

25 

22 

20 


9 

Ocmjon 

19 

23 

25 

23 


10 

Ormjon 

21 

21 

29 

23 


11 

Ormson 

23 

19 

24 

20 


12 

Zollaco 

24 

20 

30 

26 


13 

Zollaco 

20 

24 

28 

25 


14 

Zollaco 

25 

22 

29 

24 


15 

Filbeck 

27 

24 

28 

28 


16 

Filbeck 

25 

24 

28 

30 


17 

Filbeck 

23 

24 

28 

26 


_ia 
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Para explicar la hoja de cálculo, considere los “20, 21, 22” de las filas de “Deans” y la colum- 
na de “Hickory St”. Éstas son las tres mediciones del tiempo de recorrido por la ruta Hickory 
Street de Deans. Específicamente, Deans condujo por la ruta Hickory Street la primera vez en 
20 minutos, en 21 minutos la segunda y en 22 minutos la tercera. 

Ahora ANOVA tiene tres conjuntos de hipótesis que se deben probar: 

1 . H 0 : No hay interacción entre conductores y rutas. 

Hay interacción entre conductores y rutas. 

2. H 0 : Las medias de los conductores son ¡guales. 

H -\ : Las medias de los conductores no son ¡guales. 

3. H 0 : Las medias de las rutas son ¡guales. 

H -\ : Las medias de las rutas no son iguales. 

Observe que se identifica el efecto del conductor como factor A, y el de la ruta, como 

factor B. 

Cada hipótesis se prueba con el estadístico F. Es factible utilizar una regla de decisión 
de cada una de las pruebas anteriores o emplear los valores p de cada prueba. En este caso 
se aplicará el nivel de significancia 0.05 para compararlo con el valor p generado por el soft- 
ware estadístico. Por lo tanto, se rechazan las diversas hipótesis nulas si el valor p es menor 
que 0.05. En lugar de calcular la suma cuadrática del tratamiento y los bloques, se calcula la 
suma cuadrática de los factores y las interacciones. Los cálculos de la suma cuadrática de los 
factores son muy similares a los cálculos de SST y SSB calculados antes. Vea las fórmulas 
(12-4) y (12.6). La suma cuadrática debida a una posible interacción es: 

SSI = n/bk [22 (Xa - X¡ - X, + X G ) 2 ] (12-8) 


donde: 

i es un subíndice o Identificación que representa una ruta. 

¡ es un subíndice o identificación que representa a un conductor. 
k es el número de niveles del factor A (efecto de la ruta). 
b es el número de niveles del factor B (efecto del conductor). 
n es el número de observaciones. 

X.. es el tiempo de recorrido medio en la ruta, /, por el conductor,/. Observe que éstas son 
las medias que se trazaron en la gráfica en la página 436. 

X¡ es el tiempo de recorrido medio por la ruta /'. Observe que el punto muestra que la 
media se calculó el tiempo de todos los conductores. Éstas son las medias de las 
rutas que se compararon en la página 434. 

X ¡ es el tiempo de recorrido medio del conductor j. Observe que el punto muestra que la 
media se calculó sobre todas las rutas. Éstas son las medias de los conductores que 
se compararon en la página 434. 

X G es la media total. 

Una vez que se tiene SSI, entonces SSE se determina como: 

SSE = SS total - SS factor A - SS factor B - SSI (12-9) 

La tabla ANOVA completa, con interacciones, es: 


Fuente 

Suma cuadrática 

gi 

Media cuadrática 

F 

Ruta 

Factor A 

k - 1 

SSA/(Ar — 1) = MSA 

MSA/MSE 

Conductor 

Factor B 

b - 1 

SSB/(ó - 1) = MSB 

MSB/MSE 

Interacción 

SSI 

(k - 1)(¿> - 1) 

SSI /[(k — 1)(P — 1)] = MSI 

MSI/MSE 

Error 

SSE 

n - kb 

SSE /(n - kb) = MSE 


Total 

SS total 

n - 1 
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La captura de pantalla resultante de Excel muestra un resumen de la estadística descriptiva 
de cada conductor y una tabla ANOVA. 


W¿y Ana 


with interactiom 
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11 
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15 
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1 

1 
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19 
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•s 

43 

79 

46 

270 00 
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21 

21 

24 

22 

22 SO 
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0 

4 

7 

1 
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El valor p de interacciones de 0.036 (resaltado en color amarillo) es menor que nuestro nivel 
de significancia de 0.05. Por lo tanto, la decisión es rechazar la hipótesis nula de no Interac- 
ción, y concluir que la combinación de ruta y conductor tiene un efecto significativo en la varia- 
ble de respuesta, que es el tiempo de recorrido. 

Los efectos de la interacción proporcionan información acerca de los efectos combinados 
de las variables. Si está presente la interacción, se deberá efectuar una prueba ANOVA de una 
vía para probar diferencias entre las medias del factor por cada nivel del otro factor. Este aná- 
lisis requiere tiempo y esfuerzo, pero los resultados son muy interesantes. 

El análisis continúa con una ANOVA de una vía por cada conductor para probar la hipóte- 
sis: H 0 : Los tiempos de recorrido de las rutas son iguales. Los resultados son los siguientes. 


Deans: H 0 : Los tiempos de recorrido de las rutas son iguales. 

Snaverly: H 0 : Los tiempos de recorrido de las rutas son iguales. 

Fuente DF SS MS F P 

Deans RTE 3 51.00 17.00 2.43 0.140 

Error 8 56.00 7.00 

Total 11 107.00 

Fuente DF SS MS F P 

SN RTE 3 102.00 34.00 7.16 0.012 

Error 8 38.00 4.75 

Total 11 140.00 

Ormson: W„: Los tiempos de recorrido de las rutas son ¡guales. 

Zollaco: W„: Los tiempos de recorrido de las rutas son ¡guales. 

Fuente DF SS MS F P 

Ormson RTE 3 51.00 17.00 3.78 0.059 

Error 8 36.00 4.50 

Total 11 87.00 

Fuente DF SS MS F P 

Z-RTE 3 86.25 28.75 8.85 0.006 

Error 8 26.00 3.25 

Total 11 112.25 

Fllbeck: H 0 : Los tiempos de recorrido de las rutas son iguales. 


Fuente DF SS MS F P 

Filbeck RTE 3 38.25 12.75 6.38 0.016 

Error 8 16.00 2.00 

Total 11 54.25 



Recuerde los resultados de ANOVA de dos vías sin interacción de la página 433. En ese aná- 
lisis, los resultados mostraron en forma clara que el factor “ruta” tenía un efecto significativo 
en el tiempo de recorrido. Sin embargo, ahora que se incluye el efecto interacción, los resul- 
tados muestran que, por lo general, la conclusión no es verdadera. Al revisar los anteriores 
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valores p de las cinco tablas ANOVA de una vía (rechace la hipótesis nula si el valor p es menor 
que 0.05), se sabe que los tiempos de recorrido medios de las rutas son distintos en el caso 
de tres conductores: Filbeck, Snaverly y Zollaco. Sin embargo, en el de Deans y Ormson, sus 
tiempos de recorrido medios de las rutas no difieren de manera significativa. 

Ahora que se conoce esta nueva e interesante información, se quiere saber por qué exis- 
ten estas diferencias. Se requerirá una investigación más profunda de los hábitos de conduc- 
ción de los cinco conductores. 

En resumen, la presentación de ANOVA de dos vías con interacción demuestra el poder 
del análisis estadístico. En este análisis se demostró el efecto combinado del conductor y la 
ruta sobre el tiempo de recorrido, y también que los distintos conductores, en efecto, se com- 
portan de manera diferente cuando recorren sus rutas. Conocer los efectos de la interacción 
es muy importante en muchas aplicaciones, desde áreas científicas, como agricultura y con- 
trol de calidad, hasta campos gerenciales, como administración de recursos humanos y equi- 
dad de género en las tabulaciones salariales y evaluaciones de desempeño. 


r 


Autoevaluación 


12-5 


Vea la siguiente tabla ANOVA. 


■\ 



ANOVA 

Fuente de variación 

SS 

gi 

MS 

F 

Valor p 

Factor A 

6.41 

3 

2.137 

3.46 

0.0322 

Factor B 

5.01 

2 

2.507 

4.06 

0.0304 

Interacción 

33.15 

6 

5.525 

8.94 

0.0000 

Error 

14.83 

24 

0.618 



Total 

59.41 

35 





Utilice el nivel de significancia de 0.05 para responder las siguientes preguntas. 

a) ¿Cuántos niveles tiene el factor A? ¿Existe una diferencia significativa entre las medias del fac- 
tor A? ¿Cómo lo sabe? 

tí) ¿Cuántos niveles tiene el factor B? ¿Existe una diferencia significativa entre las medias del fac- 
tor B? ¿Cómo lo sabe? 

c) ¿Cuántas observaciones hay en cada celda? ¿Existe alguna interacción significativa entre el fac- 
tor A y el factor B sobre la variable de respuesta? ¿Cómo lo sabe? 


comed: 


Ejercicios 

19. Considere los siguientes datos muéstrales de un experimento ANOVA de dos factores: 



Chico 

Tamaño 

Mediano 

Grande 


23 

20 

11 

Pesado 

21 

32 

20 


25 

26 

20 

Peso 





13 

20 

11 

Ligero 

32 

17 

23 


17 

15 

8 


Utilice el nivel de significancia de 0.05 para responder las siguientes preguntas. 

a) ¿Hay alguna diferencia entre las medias del tamaño? 

b ) ¿Hay alguna diferencia entre las medias del peso? 

c) ¿Hay alguna interacción significativa entre peso y tamaño? 
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20. Considere la tabla ANOVA de dos vías parcialmente terminada. Suponga que hay cuatro niveles 
del factor A y tres niveles del factor B. El número de réplicas por celda es 5. Complete la tabla y 
realice pruebas para determinar si hay alguna diferencia significativa entre las medias del factor A, 
entre las medias del factor B o entre las medias de la interacción. Utilice el nivel de significancia 
de 0.05. ( Sugerencia : estime los valores de la tabla F.) 


ANOVA 


Fuente 

SS 

Factor A 

75 

Factor B 

25 

Interacción 

300 

Error 

600 

Total 

1 000 


21. El distribuidor del Wapakoneta Daily News, periódico regional del suroeste de Ohio, considera tres 
tipos de máquinas expendedoras, o “anaqueles”. La gerencia desea saber si los modelos de 
máquinas afectan las ventas. Los anaqueles se designan como J-1000, D-320 y UV-57. La geren- 
cia también desea saber si la ubicación de los anaqueles, ya sea dentro o fuera de los supermer- 
cados, afecta las ventas. A cada una de las seis tiendas similares les asignan de forma aleatoria 
una combinación de máquina y ubicación. Los siguientes datos muestran el número de periódicos 
vendidos durante cuatro días. m 


Ubicación/máquina 


J-1000 

D-320 

UV-57 

Dentro 

33 

40, 30, 31 

29, 28, 33, 33 

47, 39, 39, 45 

Fuera 

43 

36, 41, 40 

48, 45, 40, 44 

37, 32, 36, 35 


a) Trace la gráfica de interacción. Con base en sus observaciones, ¿hay algún efecto de interac- 
ción? A partir de la gráfica, describa el efecto de interacción entre la máquina y su posición. 

b) Utilice el nivel de significancia de 0.05 para probar los efectos de posición, máquina e interac- 
ción sobre las ventas. Reporte los resultados estadísticos. 

c) Compare las ventas medias dentro y fuera de cada máquina mediante técnicas estadísticas. 
¿Cuál es su conclusión? 

22. Una compañía importante está organizada en tres áreas funcionales: manufactura, marketing e 
investigación y desarrollo. Los empleados afirman que la compañía les paga a las mujeres menos 
que a los hombres en puestos similares. La compañía hizo una selección aleatoria de cuatro hom- 
bres y cuatro mujeres en cada área, y registró sus salarios semanales en dólares. m 


Área/género 

Femenino 

Masculino 

Manufactura 

1 016, 1 007, 875, 968 

978, 1 056, 982, 748 

Marketing 

1 045, 895, 848, 904 

1 154,1 091, 878, 876 

Investigación y desarrollo 

770, 733,844,771 

926, 1 055, 1 066, 1 088 


a) Dibuje la gráfica de interacción. Con base en sus observaciones, ¿hay algún efecto de inter- 
acción? A partir de la gráfica, describa el efecto de la interacción del género y el área sobre el 
salario. 

b) Utilice el nivel de significancia de 0.05 para probar los efectos del género, el área e interacción 
sobre el salario. Reporte los resultados estadísticos. 

c) Compare las ventas medias de hombres y mujeres en cada área mediante técnicas estadísti- 
cas. ¿Qué le recomendaría a la compañía? 
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Resumen del capítulo 

I. Las características de la distribución F son: 

A. Es continua. 

B. Sus valores no pueden ser negativos. 

C. Tiene sesgo positivo. 

D. Hay una familia de distribuciones F. Cada vez que cambian los grados de libertad en el nume- 
rador o en el denominador, se crea una distribución nueva. 

II. Con la distribución F se prueba si son iguales dos varianzas poblacionales. 

A. Las poblaciones muestreadas deben seguir la distribución normal. 

B. La mayor de las dos varianzas muéstrales se coloca en el numerador, para forzar que la razón 
sea al menos 1 .00. 

C. El valor de F se calcula con la siguiente ecuación: 



III. Una ANOVA de una vía se utiliza para comparar varias medias de tratamiento. 

A. Un tratamiento es una fuente de variación. 

B. Las suposiciones subyacentes a la prueba ANOVA son: 

1. Las muestras son de poblaciones que siguen una distribución normal. 

2. Las poblaciones tienen desviaciones estándar iguales. 

3. Las muestras son independientes. 

C. La información para determinar el valor de F se resume en una tabla ANOVA. 

1. La fórmula de SS total, el total de la suma de los cuadrados, es: 

SS total = 2(X - X G f (12-2) 

2. La fórmula de SSE, la suma de los errores ai cuadrado, es: 

SSE = 2(X — X c ) 2 (12-3) 

3. La fórmula de SST, el tratamiento de la suma de cuadrados, se determina por la resta: 

SST = SS total - SSE (12-4) 

4. Esta información se resume en la siguiente tabla y se determina el valor de F. 


Fuente de 
variación 

Suma 

de cuadrados 

Grados 
de libertad 

Media cuadrática 

F 

Tratamientos 

SST 

k- 1 

SST/(A — 1) = MST 

MST/MSE 

Error 

SSE 

n — k 

SSE/(í7 - k) = MSE 


Total 

SS total 

n - 1 




IV. Si se rechaza una hipótesis nula de tratamiento de medias iguales, se identifican los pares de 
medias diferentes a partir del intervalo de confianza siguiente. 


(X, - X 2 ) ± f, MSE 


1 1 

— H 


(12-5) 


V. En una ANOVA de dos vías se considera una segunda variable de tratamiento. 

A. La segunda variable de tratamiento se denomina variable de bloqueo. 

B. Ésta se determina con ia siguiente ecuación: 

SSB = /c2(X b - X G ) 2 (12-6) 

C. El término SSE, o suma de los errores al cuadrado, se determina a partir de la siguiente ecua- 
ción: 


SSE = SS total - SST - SSB 


(12-7) 
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D. El estadístico F de la variable de tratamiento y de la variable de bloqueo se determina en la 
siguiente tabla: 


Fuente de 
variación 

Suma 

de cuadrados 

Grados de libertad 

Media cuadrática 

F 

Tratamientos 

SST 

k - 1 

SST /(k — 1) = MST 

MST/MSE 

Bloques 

SSB 

b - 1 

SSB/(b - 1) = MSB 

MSB/MSE 

Error 

SSE 

P - 1K6 - D] 

SSE /[(k — 1)(6 — 1)] = MSE 


Total 

SS total 

n - 1 




VI. En una ANOVA de dos vías con observaciones repetidas se consideran dos variables de tratamien- 
to y la interacción posible entre las variables. 

A. La suma de cuadrados debida a interacciones posibles se determina mediante: 

SSI = n/ttr[2S (X s - X L - X¡ + X G f] ( 12 - 8 ) 

B. El término SSE se determina mediante la resta: 

SSE = SS total - SSA - SSB - SSI ( 12 - 9 ) 

C. La tabla ANOVA completa, con interacciones, es: 


Fuente 

Suma de 
cuadrados 

gi 

Media cuadrática 

F 

Factor A 

SSA 

k - 1 

SSA /{k - 1) = MSA 

MSA/MSE 

Factor B 

SSB 

b - 1 

SSB/(b - 1 ) = MSB 

MSB/MSE 

Interacción 

SSI 

(k - 1)(6 - 1) 

SSI /[(ir — 1)(6 — 1)] = MSI 

MSI/MSE 

Error 

SSE 

n - kb 

SSE/(n - kb) = MSE 


Total 

SS total 

n - 1 




Clave 

de pronunciación 


SÍMBOLO 

SIGNIFICADO 

PRONUNCIACIÓN 

SS total 

Suma del total de cuadrados 

Total de S S 

SST 

Suma del tratamiento de cuadrados 

SST 

SSE 

Suma de los errores al cuadrado 

SSE 

MSE 

Error medio cuadrático 

MSE 

SSB 

Suma de los cuadrados debida al bloque 

SSB 

SSI 

Suma de interacción de cuadrados 

SSI 


comed 


Ejercicios del capítulo 

23 . Un agente de bienes raíces del área costera de Georgia desea comparar la variación entre el pre- 
cio de venta de casas con vista al mar y el de las ubicadas a tres cuadras del mar. Una muestra 
de 21 casas con vista al mar que se vendieron el año pasado reveló que la desviación estándar de 
los precios de venta fue de $45 600. Una muestra de 18 casas, también vendidas el año pasado, 
ubicadas de una a tres cuadras del mar, reveló que la desviación estándar fue de $21 330. A un 
nivel de significancia de 0.01 , ¿puede concluir que hay más variación entre los precios de venta 
de las casas con vista al mar? 

24 . Considere un fabricante de computadoras a punto de lanzar al mercado una computadora perso- 
nal nueva, más rápida. Es evidente que la máquina nueva es más rápida que sus modelos ante- 
riores, pero las pruebas iniciales indican que hay más variación en el tiempo de procesamiento. 
Este tiempo de procesamiento depende del programa que se ejecute, de la cantidad de datos de 
entrada y de la cantidad de salida. Una muestra de 16 corridas en computadora, con diversos tra- 
bajos de producción, reveló que la desviación estándar del tiempo de procesamiento fue de 22 
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(centésimas de segundo) para la máquina nueva y de 12 (centésimas de segundo) para el mode- 
lo actual. Con un nivel de significancia de 0.05, ¿puede concluir que hay más variación en el tiem- 
po de procesamiento de la máquina nueva? 

25. En Jamestown, Nueva York, hay dos concesionarios Chevrolet. Las ventas mensuales medias en 
Sharkey Chevy y Dave White Chevrolet son más o menos iguales. Sin embargo, Tom Sharkey, pro- 
pietario de Sharkey Chevrolet, considera que sus ventas son más consistentes. A continuación se 
presenta el número de automóviles nuevos que vendió Sharkey en los últimos siete meses, y en 
los últimos ocho meses Dave Chevrolet. ¿Concuerda con Sharkey? Utilice ei nivel de significancia 
de 0.01. g¡| 


Sharkey 

98 

78 

54 

57 

68 

64 

70 


Dave White 

75 

81 

81 

30 

82 

46 

58 

101 


26. De las muestras aleatorias de cinco personas, a partir de tres poblaciones, la suma del total de 
cuadrados fue 100. La suma de cuadrados debida a los tratamientos fue 40. 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? Utilice el nivel de significancia de 0.05. 

c) Elabore la tabla ANOVA. ¿Cuál es el valor de F? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

27. En una tabla ANOVA MSE fue igual a 10. Se seleccionaron muestras aleatorias de seis personas a 
partir de cuatro poblaciones y la suma del total de cuadrados fue 250. 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión? Utilice el nivel de significancia de 0.05. 

c) Elabore la tabla ANOVA. ¿Cuál es el valor de F? 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

28. La siguiente es una tabla ANOVA parcial. 


Fuente 

Suma de 
cuadrados 

gi 

Media 

cuadrática 

F 

Tratamiento 


2 



Error 



20 


Total 

500 

11 




Complete la tabla y responda las preguntas siguientes. Utilice el nivel de significancia de 0.05. 

a) ¿Cuántos tratamientos hay? 

b) ¿Cuál es el tamaño total de la muestra? 

c) ¿Cuál es el valor crítico de F? 

d) Formule las hipótesis nula y alternativa. 

e) ¿Cuál es su conclusión respecto de la hipótesis nula? 

29. Una organización de consumidores desea saber si hay una diferencia entre los precios de un 
juguete en particular en tres tipos de tiendas. El precio del juguete se investigó en una muestra de 
cinco tiendas de descuento, cinco de artículos diversos y cinco departamentales. Los resultados 
se muestran a continuación. Utilice el nivel de significancia de 0.05. 


Descuento 

Variedad 

Departamento 

$12 

$15 

$19 

13 

17 

17 

14 

14 

16 

12 

18 

20 

15 

17 

19 


30. Jacob Lee es un viajero frecuente entre Los Ángeles y San Francisco. El mes pasado, anotó los 
tiempos de vuelo en tres aerolíneas distintas. Los resultados son: 


Goust 

Jet Red 

Cloudtran 

51 

50 

52 

51 

53 

55 

52 

52 

60 



(i continúa ) 
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Goust 

Jet Red 

Cloudtran 

42 

62 

64 

51 

53 

61 

57 

49 

49 

47 

50 

49 

47 

49 


50 

58 


60 

54 


54 

51 


49 

49 


48 

49 


48 

50 



a) Utilice el nivel de significancia de 0.05 y el proceso de prueba de hipótesis de cinco pasos para 
comprobar si existen diferencias entre los tiempos medios de vuelo de las tres aerolíneas. 

£>) Desarrolle un intervalo de confianza de 95% para la diferencia entre las medias entre Goust y 
Cloudtran. 

31. La ciudad de Maumee comprende cuatro distritos. Andy North, jefe de la policía, desea determi- 
nar si hay una diferencia entre los números medios de delitos cometidos en los cuatro distritos. 
Para esto registra el número de delitos reportados en cada distrito durante seis días. Con un nivel 
de significancia de 0.05, ¿el jefe de la policía puede concluir que hay una diferencia entre los 
números medios de delitos? m 


Número de delitos 

Reo Center 

Key Street 

Monclova 

Whitehouse 

13 

21 

12 

16 

15 

13 

14 

17 

14 

18 

15 

18 

15 

19 

13 

15 

14 

18 

12 

20 

15 

19 

15 

18 


32. En un estudio del efecto de los comerciales de televisión sobre los niños de 12 años se midió el 
tiempo de su atención, en segundos. Los comerciales fueron de ropa, alimentos y juguetes. Con 
un nivel de significancia de 0.05, ¿hay alguna diferencia entre los lapsos de atención promedio de 
los niños con respecto a los diversos comerciales? ¿Existen diferencias significativas entre pares 
de promedios? ¿Recomendaría dejar de transmitir uno de los tres tipos de comerciales? ^ ' 


Ropa 

Alimentos 

Juguetes 

26 

45 

60 

21 

48 

51 

43 

43 

43 

35 

53 

54 

28 

47 

63 

31 

42 

53 

17 

34 

48 

31 

43 

58 

20 

57 

47 


47 

51 


44 

51 


54 



33. Cuando únicamente se implican dos tratamientos, ANOVA y la prueba t de Student (capítulo 11) 
dan como resultado las mismas conclusiones. De igual forma, f 2 = F. Como ejemplo, suponga que 
se dividió al azar a 1 4 estudiantes en dos grupos, uno de 6 estudiantes y el otro de 8. A un grupo se 
le educó con una combinación de lectura y enseñanza programada, y al otro, con una combina- 
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ción de lectura y televisión. Al final del curso, a cada grupo se le aplicó un examen de 50 pregun- 
tas. La siguiente lista contiene el número correcto de respuestas de cada uno de los dos grupos. 



Lectura 
y enseñanza 
programada 

Lectura 
y televisión 

19 

32 

17 

28 

23 

31 

22 

26 

17 

23 

16 

24 


27 


25 


a) Con las técnicas del análisis de la varianza, demuestre H 0 que las dos calificaciones medias son 
iguales; a = 0.05. 

ib) Con la prueba t descrita en el capítulo 1 1 calcule f. 
c) Interprete los resultados. 

34. Hay cuatro talleres de hojalatería en Bangor, Maine, y los cuatro afirman que dan servicio de mane- 
ra eficiente a sus clientes. Para comprobar si hay alguna diferencia en el servicio, se seleccionó a 
algunos clientes de manera aleatoria de cada taller y se registraron los tiempos de espera, en días. 
Los resultados en un paquete de software estadístico son: 


Resumen 

Grupos 

Conteo 

Suma 

Promedio 

Varianza 

Taller A 

3 

15.4 

5.133333 

0.323333 

Taller B 

4 

32 

8 

1.433333 

Taller C 

5 

25.2 

5.04 

0.748 

Taller D 

4 

25.9 

6.475 

0.595833 


ANOVA 

Fuente de variación 

SS 

gi 

MS 

F 

Valor p 

Entre grupos 

23.37321 

3 

7.791069 

9.612506 

0.001632 

Dentro de grupos 

9.726167 

12 

0.810514 



Total 

33.09938 

15 





¿Hay alguna evidencia que sugiera una diferencia entre los tiempos de espera medios en los cua- 
tro talleres de hojalatería? Utilice el nivel de significancia de 0.05. 

35. Se ingresan los rendimientos de combustible de una muestra de 27 automóviles compactos, 
medianos y grandes en un paquete de software estadístico. Con el análisis de varianza se inves- 
tiga si hay una diferencia entre los kilometrajes medios de los tres tipos de automóviles. ¿Cuál es 
su conclusión? Utilice el nivel de significancia de 0.01. 


Resumen 

Grupos 

Conteo 

Suma 

Promedio 

Varianza 

Compactos 

12 

268.3 

22.35833 

9.388106 

Medianos 

9 

172.4 

19.15556 

7.315278 

Grandes 

6 

100.5 

16.75 

7.303 
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A continuación se presentan resultados adicionales. 


ANOVA 

Fuente de variación 

SS 

gi 

MS 

F 

Valor p 

Entre grupos 

136.4803 

2 

68.24014 

8.258752 

0.001866 

Dentro de grupos 

198.3064 

24 

8.262766 



Total 

334.7867 

26 





36 . En la producción de un componente para un avión se emplean tres líneas de ensamblado. Para 
estudiar la tasa de producción, se elige una muestra aleatoria con periodos de seis horas por línea 
de ensamble y se registra el número de componentes producidos en cada línea durante estos 
periodos. Los resultados de un paquete de software estadístico son: 


Resumen 

Grupos 

Conteo 

Suma 

Promedio 

Varianza 

Línea A 

6 

250 

41 .66667 

0.266667 

Línea B 

6 

260 

43.33333 

0.666667 

Línea C 

6 

249 

41.5 

0.7 


ANOVA 

Fuente de variación 

SS 

gi 

MS 

F 

Valor p 

Entre grupos 

12.33333 

2 

6.166667 

11.32653 

0.001005 

Dentro de grupos 

8.166667 

15 

0.544444 



Total 

20.5 

17 





a) Utilice un nivel de significancia de 0.01 para comprobar si hay alguna diferencia entre las pro- 
ducciones medias de las tres líneas de ensamblado. 

b) Elabore un intervalo de confianza de 99% de la diferencia en las medias entre la línea de pro- 
ducción B y la C. 

37 . El servicio postal agrupa el correo de primera clase como cartas, tarjetas, sobres y paquetes. En 
un periodo de tres semanas, un artículo de cada tipo fue enviado desde un centro administrativo 
postal. Se registró el tiempo total en tránsito. Se utilizó un paquete de software estadístico para 
efectuar el análisis. Los resultados son los siguientes: 


Fuente 

DF 

SS 

MS F P 

Factor 

3 

13 . 82 

4.61 2.72 0.051 

Error 

68 

115 . 17 

1 . 69 

Total 

71 

128 . 99 


S = 1.301 

R-Sq = 10.71 

% R-Sq(adj) = 6.77% 




Intervalo de confianza individual al 95% 
para la media basada en la desviación 



Desv . 

estándar conjunta. 

Nivel 

N 

Media Est . 

i 

i 

4- 

i 

i 

i 

i 

i 

i 

i 

i 

i 

+ 

i 

i 

i 

i 

i 

i 

i 

i 

i 

+ 

i 

i 

i 

i 

i 

i 

i 

i 

i 

4- 

l 

l 

l 

l 

l 

l 

Cartas 

18 

1.444 1.097 

( * > 

Tar j etas 

18 

1.667 1.455 

( * ) 

Sobres 

18 

2.444 1.617 

( * ) 

Paquetes 

18 

2.389 0.916 

( * ) 


1.20 1.80 2.40 3.00 


Aplique un nivel de significancia de 0.05 para comprobar si esta evidencia sugiere que hay dife- 
rencias entre las medias de los distintos tipos de correo de primera clase. 
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38. Usted emplea un filtro para bloquear el correo no deseado en su bandeja de entrada. Registra el 
número de mensajes bloqueados por día de la semana y utiliza un software estadístico para efec- 
tuar el análisis. Los resultados son los siguientes: 


Fuente 

DF 

ss 


MS F P 

Factor 

6 

1367 . 8 

228 

.0 5.72 0.000 

Error 

48 

1913.2 

39 

.9 

Total 

54 

3281 . 0 



S = 6.313 


R-Sq = 41 

..69% 

R-Sq(adj) = 34.40% 





Intervalo de confianza individual al 95% 





para la media basada en la desviación 



Desv . 

estándar conjunta. 

Nivel 

N 

Media Est . 

i 

i 

4- 

i 

l 

i 

l 

l 

l 

l 

l 

4- 

i 

i 

i 

i 

i 

i 

i 

i 

i 

4- 

l 

l 

l 

l 

l 

l 

l 

l 

l 

4- 

l 

l 

Lunes 

10 

74.000 6. 

164 

( * ) 

Martes 

9 

66.111 7. 

288 

{ * ) 

Miércoles 

7 

74.143 2. 

268 

( * ) 

Jueves 

8 

62.375 5. 

041 

( * ) 

Viernes 

8 

75.125 4. 

454 

( * ) 

Sábado 

5 

63.200 7. 

259 

( * ) 

Domingo 

8 

72.375 9. 

164 

( * j 


60.0 66.0 72.0 78.0 


Aplique un nivel de significancia de 0.05 para comprobar si esta evidencia sugiere que hay dife- 
rencias entre las medias de los distintos días de la semana. 

39. En Shank’s, inc., empresa publicitaria, desea saber si el tamaño y el color de un anuncio publici- 
tario generan respuestas diferentes de los lectores de revistas. A un grupo de lectores se le mues- 
tran anuncios con cuatro colores distintos y de tres tamaños diferentes. A cada lector se le pide 
dar a cada combinación de tamaño y color una calificación entre 1 y 10. Suponga que las califica- 
ciones siguen la distribución normal. La calificación de cada combinación se muestra en la si- 
guiente tabla (por ejemplo, la calificación de un anuncio pequeño en color rojo es 2). m 


Tamaño 

del anuncio 


Color del anuncio 


Rojo 

Azul 

Naranja 

Verde 

Pequeño 

2 

3 

3 

8 

Mediano 

3 

5 

6 

7 

Grande 

6 

7 

8 

8 


¿Hay alguna diferencia en la eficacia de un anuncio con base en su color y su tamaño? Utilice el 
nivel de significancia de 0.05. 

40. En el área de Columbus, Georgia, hay cuatro restaurantes McBurger. En la siguiente tabla se mues- 
tran los números de hamburguesas que vendió cada uno de ellos en cada una de las últimas seis 
semanas. A un nivel de significancia de 0.05 y cuando se considera el factor de la semana, ¿hay 
alguna diferencia entre los números medios que vendieron los cuatro restaurantes? m 


Semana 


Restaurante 


Metro 

Interestatal 

Universidad 

Río 

1 

124 

160 

320 

190 

2 

234 

220 

340 

230 

3 

430 

290 

290 

240 

4 

105 

245 

310 

170 

5 

240 

205 

280 

180 

6 

310 

260 

270 

205 


a) ¿Hay alguna diferencia entre las medias de tratamiento? 

b) ¿Hay alguna diferencia entre las medias de bloqueo? 
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41 . En la ciudad de Tucson, Arizona, se emplean personas para valuar las casas con el fin de estable- 
cer el impuesto predial. El administrador municipal envía a cada valuador a las mismas cinco casas 
y después compara los resultados. La Información se presenta a continuación, en miles de dóla- 
res. ¿Puede concluir que hay una diferencia entre los avalúos, con a = 0.05? ^ [i 


Casa 


Valuador 


Zawodny 

Norman 

Cingle 

Holiday 

A 

$53.0 

$55.0 

$49.0 

$45.0 

B 

50.0 

51.0 

52.0 

53.0 

C 

48.0 

52.0 

47.0 

53.0 

D 

70.0 

68.0 

65.0 

64.0 

E 

84.0 

89.0 

92.0 

86.0 


a) ¿Hay alguna diferencia entre las medias de tratamiento? 

¿>) ¿Hay alguna diferencia entre las medias de bloqueo? 

42 . El concesionario Martin Motors tiene tres automóviles de la misma marca y modelo. El director 
desea comparar el consumo de combustible de ellos (designados automóvil A, B y C) con cuatro 
tipos de gasolina. En cada prueba se puso un galón de gasolina al tanque vacío de los automóvi- 
les y se condujeron hasta que se agotó. En la siguiente tabla se muestra el número de millas que 
se recorrieron en cada prueba. Sffí 


Distancia (millas) 

Tipos de gasolina Automóvil A Automóvil B Automóvil C 


Regular 

22.4 

20.8 

21.5 

Súper regular 

17.0 

19.4 

20.7 

Sin plomo 

19.2 

20.2 

21.2 

Premium sin plomo 

20.3 

18.6 

20.4 


A un nivel de significancia de 0.05: 

a) ¿Hay alguna diferencia entre los tipos de gasolina? 

b) ¿Hay alguna diferencia entre los automóviles? 

43 . Una empresa de investigación desea comparar el rendimiento, en millas por galón, de gasolina 
regular, de grado medio y de Premium. Con base en el desempeño de los diversos automóviles, 
se seleccionan y tratan como bloques siete automóviles. Por lo tanto, cada tipo de gasolina se 
probó en cada tipo de automóvil. Los resultados de las pruebas, en millas por galón, se muestran 
en la siguiente tabla. Con un nivel de significancia de 0.05, ¿hay alguna diferencia entre las gaso- 
linas o entre los automóviles? m 


Automóvil 

Regular 

De grado medio 

Premium 

1 

21 

23 

26 

2 

23 

22 

25 

3 

24 

25 

27 

4 

24 

24 

26 

5 

26 

26 

30 

6 

26 

24 

27 

7 

28 

27 

32 


44 . Tres cadenas de supermercados del área de Denver, Colorado, afirman tener los precios más 
bajos. Como parte de un estudio de investigación sobre la publicidad de los supermercados, el 
Denver Daily News realizó un estudio. Primero seleccionó una muestra aleatoria de nueve artícu- 
los. Luego, verificó el precio de cada artículo seleccionado en cada una de las tres cadenas el 


450 


CAPÍTULO 12 Análisis de la varianza 


mismo día. A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los precios medios de 
los supermercados o de los artículos? ^ ^ 


Artículo 

SúperS 

Ralph’s 

Lowblaws 

1 

$1.12 

$1.02 

$1.07 

2 

1.14 

1.10 

1.21 

3 

1.72 

1.97 

2.08 

4 

2.22 

2.09 

2.32 

5 

2.40 

2.10 

2.30 

6 

4.04 

4.32 

4.15 

7 

5.05 

4.95 

5.05 

8 

4.68 

4.13 

4.67 

9 

5.52 

5.46 

5.86 


45. A continuación se enumeran los pesos (en gramos) de una muestra de dulces M&M, clasificados 
según su color. Utilice un paquete de software estadístico para determinar si hay alguna diferen- 
cia entre los pesos medios de los dulces de colores distintos. Emplee un nivel de significancia de 


0.05. 


m 


Rojo 

Naranja 

Amarillo 

Café 

Café claro 

Verde 

0.946 

0.902 

0.929 

0.896 

0.845 

0.935 

1.107 

0.943 

0.960 

0.888 

0.909 

0.903 

0.913 

0.916 

0.938 

0.906 

0.873 

0.865 

0.904 

0.910 

0.933 

0.941 

0.902 

0.822 

0.926 

0.903 

0.932 

0.838 

0.956 

0.871 

0.926 

0.901 

0.899 

0.892 

0.959 

0.905 

1.006 

0.919 

0.907 

0.905 

0.916 

0.905 

0.914 

0.901 

0.906 

0.824 

0.822 

0.852 

0.922 

0.930 

0.930 

0.908 


0.965 

1.052 

0.883 

0.952 

0.833 


0.898 

0.903 


0.939 




0.895 


0.940 






0.882 






0.906 





46. Hay cuatro estaciones de radio en Midland con formatos diferentes (rock pesado, música clásica, 
country/western e instrumental). Cada una de ellas tiene interés por saber el número de minutos 
de música que transmite por hora. De una muestra de 10 horas de cada estación, se obtuvieron 
las medias muéstrales siguientes. 

X, = 51 .32 X 2 = 44.64 X 3 = 47.2 X 4 = 50.85 
SS total = 650.75 


a) Determine SST. 

b) Determine SSE. 

c) Elabore una tabla ANOVA. 

d) A un nivel de significancia de 0.05, ¿hay alguna diferencia entre las medias de tratamiento? 

e) ¿Hay alguna diferencia entre las cantidades medias del tiempo de música entre la estación 1 y 
la estación 4? Utilice el nivel de significancia de 0.05. 

Se recomienda que resuelva los ejercicios siguientes con un paquete de software estadístico como 
Excel, MegaStat o Minitab. 

47. La American Accounting Association realizó un estudio para comparar los salarios semanales de 
hombres y mujeres empleados en el sector público o privado en contabilidad. ^ 
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Género 

Sector 

Público 

Privado 

Hombres 

$ 978 

$1 335 


1 035 

1 167 


964 

1 236 


996 

1 317 


1 117 

1 192 

Mujeres 

$ 863 

$1 079 


975 

1 160 


999 

1 063 


1 019 

1 110 


1 037 

1 093 


A un nivel de significancia de 0.05: 

a) Trace una gráfica de interacción de las medias de los hombres y las mujeres según el sector. 

b) Pruebe el efecto de interacción del género y el sector en los salarios. 

c) Con base en los resultados del inciso b), realice las pruebas de hipótesis adecuadas para de- 
tectar las diferencias entre las medias de los factores. 

d) Interprete los resultados en un reporte breve. 

48. Robert Altoff es vicepresidente de ingeniería de un fabricante de máquinas lavadoras domésticas. 
Como parte del desarrollo de un producto nuevo, Altoff desea determinar el tiempo óptimo del 
ciclo de lavado. Parte del desarrollo es estudiar la relación entre el detergente empleado (cuatro 
marcas) y la duración del ciclo de lavado (18, 20, 22 o 24 minutos). A fin de realizar el experimen- 
to se asignan 32 cargas estándar de ropa (con igual contenido de suciedad y pesos totales igua- 
les) a las 16 combinaciones detergente-ciclo de lavado. Los resultados (en libras de suciedad 
eliminada) se muestran en la siguiente tabla. i 


Marca del detergente 

Tiempo del ciclo (min] 


18 

20 

22 

24 

A 

0.13 

0.12 

0.19 

0.15 


0.11 

0.11 

0.17 

0.18 

B 

0.14 

0.15 

0.18 

0.20 


0.10 

0.14 

0.17 

0.18 

C 

0.16 

0.15 

0.18 

0.19 


0.17 

0.14 

0.19 

0.21 

D 

0.09 

0.12 

0.16 

0.15 


0.13 

0.13 

0.16 

0.17 


A un nivel de significancia de 0.05: 

a) Trace una gráfica de interacción de las medias del detergente según el tiempo del ciclo, 
ib) Pruebe el efecto de interacción de la marca y el tiempo del ciclo sobre la “suciedad eliminada”. 

c) Con base en los resultados del inciso b), realice las pruebas de hipótesis apropiadas de las dife- 
rencias entre las medias de los factores. 

d) Interprete los resultados en un reporte breve. 


Ejercicios de lo base de datos 

49. Consulte los datos de Real State, en los cuales se reporta información sobre las casas que se ven- 
dieron en Goodyear, Arizona, durante el año pasado. 

a) A un nivel de significancia de 0.02, ¿hay alguna diferencia entre la variabilidad de los precios 
de venta de las casas que tienen alberca con las que no tienen? 
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ib) A un nivel de significancia de 0.02, ¿hay alguna diferencia entre la variabilidad de los precios 
de venta de las casas con cochera en comparación con las que no tienen? 

c) A un nivel de significancia de 0.05, ¿hay alguna diferencia entre los precios de venta medios de 
las casas de los cinco municipios? 

50. Consulte los datos de Baseball 2009, donde se reporta información sobre los 30 equipos de la Liga 

Mayor de Béisbol durante la temporada 2009. 

a) A un nivel de significancia de 0.10, ¿hay alguna diferencia entre la variación de ios salarios de 
los equipos entre los equipos de la liga Nacional y la Americana? 

b) Establezca una variable que clasifique la asistencia total a los juegos del equipo en tres grupos: 
menos de 2.0 (millones), de 2.0 a 3.0, y de 3.0 o más. Con un nivel de significancia de 0.05, 
¿hay alguna diferencia entre los números medios de juegos ganados en los tres grupos? Utilice 
el nivel de significancia 0.01. 

c) Con la misma variable de asistencia que estableció en el inciso b), ¿hay alguna diferencia entre 
los promedios de bateo medios del equipo? Utilice el nivel de significancia de 0.01. 

d) Con la misma variable de asistencia que estableció en el inciso b), ¿hay alguna diferencia entre 
los salarios medios de los tres grupos? Utilice el nivel de significancia de 0.01. 

51. Consulte los datos de los autobuses escolares del Distrito Escolar Buena. 

a) Realice una prueba de hipótesis para averiguar si los costos medios de mantenimiento de cada 
autobús son iguales. Utilice el nivel de significancia de 0.01. 

b) Realice una prueba de hipótesis para determinar si los números medios de millas que recorrió 
cada autobús son iguales. Utilice el nivel de significancia de 0.05. 

c) Desarrolle un intervalo de confianza de 95% de la disparidad en el costo promedio de mante- 
nimiento entre los autobuses fabricados por Bluebird y Thompson. 


Comandos de software 

1. Los comandos en Excel de la prueba de varianzas de la 

página 415 son: 

a) Escriba los datos de la carretera U.S. 25 en la columna 
A y los de la 1-75 en la columna B. Ponga nombre a 
ambas columnas. 

¿>) Seleccione la pestaña de Data en la barra de herramien- 
tas. En el extremo derecho, seleccione Data Analysis, 
seleccione F-Test: Two-Sample for Variances y haga 
clic en OK. 

c) El rango de la primera variable es A1:A8, y B1:B9 el de 
la segunda. Haga clic en Labels, escriba 0.05 para 
Alpha, seleccione DI para Output Range y haga clic en 

OK. 



2. Los comandos en Excel de la prueba ANOVA de una vía de 

la página 424 son: 

a) Escriba los datos en cuatro columnas identificadas: 
Northern, TWA, Pocono y Branson. 

b) Seleccione la pestaña Data en la barra de herramientas. 
En el extremo derecho, seleccione Data Analysis. Se- 
leccione ANOVA: Single Factor y haga clic en OK. 

c) En el cuadro de diálogo siguiente establezca el rango de 
entrada A 1: D8, haga clic en Grouped by Columns, se- 
leccione Labels in first row, el cuadro de texto Alpha es 
0.05, y finalmente seleccione Output Range como F1 y 
haga clic en OK. 
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3. Los comandos en Minitab de la prueba ANOVA de una vía de 
la página 424 son: 

a) Escriba los datos en cuatro columnas e identifíquelas 
como Northern, TWA, Pocono y Branson. 

b) Seleccione Stat, ANOVA y One-way (Unstacked). se- 
leccione los datos en las columnas C1 a C4, haga clic en 
Select abajo a la izquierda y después haga clic en OK. 



4. Los comandos de Excel de la prueba ANOVA de dos vías de 

la página 434 son: 

a) En la primera fila de la primera columna escriba la pala- 
bra Driver, después ingrese los cinco conductores en la 
primera columna. En la primera fila de las cuatro colum- 
nas siguientes escriba el nombre de las rutas. Escriba 
los datos bajo cada nombre de la ruta. 

b) Seleccione la pestaña Data en la barra de herramientas. 
En el extremo derecho, seleccione Data Analysis, selec- 
cione ANOVA: Two-Factor Without Replication, y des- 
pués haga clic en OK. 

c) En el cuadro de diálogo, el Input Range es A3:E8 , haga 
clic en Labels, seleccione G3 para el Output Range y 
luego haga clic en OK. 

5. Los comandos en Excel de la prueba ANOVA de dos vías 

con interacción de la página 439 son: 

a) Escriba los datos en Excel como se muestra en la pági- 
na 437. 

b) Seleccione la pestaña Data en la barra de herramientas. 
En el extremo derecho, seleccione Data Analysis. Se- 
leccione ANOVA: Two-Factor With Replication, y des- 
pués haga clic en OK. 

c) En el cuadro de diálogo, escriba el Input Range como 
B2:F17 , escriba Rows per simple como 3, seleccione 
New Worksheet Ply y después haga clic en OK. 
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Capítulo 12 


Respuestas a las autoevaluaciones 



12-1 Suponga que los ensamblados de Mark son la población 
1; entonces, H 0 : cr 2 < or¡; Hp <x 2 > oj; gl-¡ =10-1 = 9, 

y gl 2 también es igual a 9. H 0 se rechaza si F > 3.1 8. 


( 2 . 0 ) 

(1.5) 2 


H 0 no se rechaza. La variación es la misma para los dos 
empleados. 


12-2 


a) H 0 \ ^ = n. 2 = m. 3 


b) 

c) 


Hp Al menos una media de tratamiento es diferente. 
Rechace H 0 si F > 4.26 


- 240 
X “ 12 


20 


SS total = (18- 2 O) 2 + ■ ■ ■ + (32 - 20) 2 
= 578 


SSE = (18 - 1 7) 2 + (14 - 1 7) 2 + ■ ■ - + 
(32 - 29) 2 
= 74 

SST = 578 - 74 = 504 


Fuente 

Suma de 
cuadrados 

Grados de 
libertad 

Media 

cuadrática 

F 

Tratamiento 

504 

2 

252 

30.65 

Error 

74 

9 

8.22 


Total 

578 

11 




e) H 0 se rechaza. Hay una diferencia entre los números 
medios de botellas vendidas en las distintas ubicacio- 
nes. 

12-3 a) H 0 \ m-, = F 2 = F 3 

H-¡: No todas las medias son iguales. 

b) H 0 se rechaza si F > 3.98. 

c) X G = 8.86, X, = 11, X 2 = 8.75, X 3 = 6.8 
SS total = 53.71 

SST = 44.16 
SSE = 9.55 


d) H 0 se rechaza. Las medias dg tratamiento difieren. 

e) (11.0 - 6.8) ± 2.201 V0.8682É + §) = 

4.2 ± 1.30 = 2.90 y 5.50 

Estas medias de tratamiento difieren debido a que los 
dos puntos extremos del intervalo de confianza tienen 
signo igual, que en este problema es positivo. 

12-4 Para los tipos: 

H o- Fi = P 2 = Fs 

Hp Las medias de tratamiento no son iguales. 
Rechace H 0 si F > 4.46. 

Para los meses: 

H 0 - r*,-| p*2 — F3 — F4 — F5 

Hp Las medias de bloqueo no son iguales. 

Rechace H 0 si F > 3.84. 

El análisis de la tabla de la varianza es el siguiente: 


Fuente 

9' 

SS 

MS 

F 

Tipos 

2 

3.60 

1.80 

0.39 

Meses 

4 

31 .73 

7.93 

1.71 

Error 

8 

37.07 

4.63 


Total 

14 

72.40 




La hipótesis nula no se puede rechazar para cualquier 
tipo o mes. No hay diferencia entre las ventas medias 
entre tipos o meses. 

12-5 a) Hay cuatro niveles del factor A. El valor p es menor 
que 0.05, por lo cual las medias del factor A difieren. 

b) Hay tres niveles del factor B. El valor p es menor que 
0.05, por lo cual las medias del factor B difieren. 

c) Hay tres observaciones en cada celda, y una interac- 
ción entre las medias del factor A y del factor B, debi- 
do a que el valor p es menor que 0.05. 


Fuente 

Suma de 
cuadrados 

9' 

Media 

cuadrática 

F 

Tratamiento 

44.16 

2 

22.08 

25.43 

Error 

9.55 

11 

0.8682 


Total 

53.71 

13 
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Repaso de los capítulos 10 al 12 

Esta sección es un repaso de los conceptos y términos importantes que se presentaron en los capítulos 
10, 11 y 12. En el capítulo 10 se inició el estudio de la prueba de hipótesis. Una hipótesis es una afirma- 
ción acerca del valor del parámetro de una población. Una prueba de hipótesis estadística comienza con 
una afirmación respecto del valor del parámetro de la población en la hipótesis nula. Se establece la hipó- 
tesis nula para realizar las pruebas. Al completar la prueba se debe rechazar o no la hipótesis nula. Si la 
hipótesis nula se rechaza, se concluye que la hipótesis alternativa es verdadera. La hipótesis alternativa se 
“acepta” sólo si se demuestra que la hipótesis nula es falsa. A la hipótesis alternativa también se le desig- 
na como hipótesis de investigación. La mayoría de las veces se desea probar la hipótesis alternativa. 

En el capítulo 10 se seleccionaron muestras aleatorias de una sola población y se probó si era razo- 
nable que el parámetro de la población en estudio igualara un valor en particular. Por ejemplo, para 
investigar si el tiempo medio de duración en el puesto de director ejecutivo en empresas importantes es 
de 12 años, se selecciona una muestra de directores ejecutivos, se calcula la media muestral y se com- 
para con la población. La población individual en consideración es la duración de los directores ejecu- 
tivos de empresas importantes. Se describen métodos para conducir la prueba cuando la desviación 
estándar de la población estaba disponible y cuando no lo estaba. Asimismo, en este capítulo se reali- 
zaron pruebas de hipótesis respecto de la proporción de la población. Una proporción es la fracción de 
individuos u objetos que posee una característica determinada. Por ejemplo, los registros de la industria 
indican que 70% de las ventas de gasolina para automóviles es de gasolina regular. Una muestra de 1 00 
ventas durante el mes pasado en Pantry, Conway, reveló que 76 fueron de gasolina regular. ¿Pueden los 
dueños concluir que más de 70% de sus clientes compró gasolina regular? 

En el capítulo 1 1 se amplió la idea de prueba de hipótesis para verificar si dos muestras aleato- 
rias independientes provenían de poblaciones con las mismas o iguales medias poblacionales. Por 
ejemplo, el St. Mathews Hospital opera una sala de urgencias en las zonas norte y sur de Knoxville, 
Tennessee. La pregunta de investigación es: ¿el tiempo de espera medio de los pacientes es igual 
en las dos salas? Para responder esta pregunta, se selecciona una muestra aleatoria de cada sala y 
se calculan las medias muéstrales. Se prueba la hipótesis nula que el tiempo de espera medio es el 
mismo en las dos salas. La hipótesis alternativa es que el tiempo medio de espera no es el mismo en 
las dos salas. Si se conocen las desviaciones estándar de cada población, se utiliza la distribución z 
como la distribución del estadístico de prueba. Si no se conocen, el estadístico de prueba sigue la dis- 
tribución t. 

El estudio del capítulo 1 1 también incluyó muestras dependientes, en cuyo caso se aplicó la prue- 
ba de la diferencia pareada. El estadístico de prueba es la distribución t. Un problema común de mues- 
tra pareada requiere el registro de la presión arterial de individuos antes de la administración de 
medicamento y después hacer de nuevo el registro para evaluar la eficacia de la medicina. También se 
consideró el caso de probar dos proporciones poblacionales. Por ejemplo, el gerente de producción 
desea comparar la proporción de defectos que se generan en el turno matutino con la del turno ves- 
pertino. 

El capítulo 11 trató sobre la diferencia entre dos medias poblacionales. En el capítulo 12 se pre- 
sentaron pruebas para varianzas y un procedimiento denominado análisis de la varianza, o ANOVA. Con 
este procedimiento se determina de manera simultánea si varias poblaciones normales e independien- 
tes tienen la misma media. Este procedimiento se lleva a cabo mediante la comparación de las varian- 
zas de las muestras aleatorias seleccionadas de estas poblaciones. Se aplica el procedimiento habitual 
de prueba de hipótesis, pero se utiliza la distribución F como el estadístico de prueba. Con frecuencia, 
los cálculos son tediosos, por lo que se recomienda el uso de un paquete de software estadístico. 

Como ejemplo del análisis de la varianza, se puede realizar una prueba para determinar si hay 
alguna diferencia entre las eficacias de cinco fertilizantes sobre el peso de mazorcas de maíz para hacer 
rosetas. A este tipo de análisis se le conoce como ANOVA de un factor, pues es posible obtener con- 
clusiones acerca de sólo un factor, denominado tratamiento. Si se desea obtener conclusiones respec- 
to de los efectos simultáneos de más de un factor o variable, se utiliza la técnica ANOVA de dos 
factores. En las dos pruebas, de un factor y de dos, se emplea la distribución F como la distribución 
del estadístico de prueba. La distribución F también es la distribución del estadístico de prueba para 
determinar si una población normal varía más que otra. 

El análisis de la varianza de dos factores se complica aún más por la posibilidad de que existan 
interacciones entre los factores. Hay una interacción si la respuesta a uno de los factores depende del 
nivel del otro factor. Por fortuna, la técnica ANOVA se amplía con facilidad para incluir una prueba de 
interacciones. 
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Glosario 


Capítulo 10 

Alpha Probabilidad de un error tipo I o del nivel de significan- 
cia. Su símbolo es la letra griega a. 

Error tipo I Se comete cuando se rechaza una H 0 verdadera. 
Error tipo II Se comete cuando se acepta una H 0 falsa. 
Grados de libertad Número de elementos de una muestra que 
tienen libertad para variar. Suponga que hay dos elementos en 
una muestra y se conoce la media. Se tiene libertad de especifi- 
car sólo uno de los dos valores, debido a que el otro valor se 
determina de manera automática (pues el total de los dos valo- 
res es el doble de la media). Ejemplo: si la media es $6, se tiene 
libertad de elegir sólo un valor. Si elige $4, el otro valor es $8, por- 
que $4 + $8 = 2($6). Por lo tanto, hay 1 grado de libertad en este 
ejemplo. Se pueden determinar los grados de libertad mediante 
n - 1 =2-1 = 1 . Si n es 4, hay 3 grados de libertad, determina- 
dos por n-1 = 4-1 =3. 

Hipótesis Declaración o afirmación sobre el valor de un pará- 
metro de la población. Ejemplos: 40.7% de todas las personas 
de 65 años o mayores viven solas. El número medio de perso- 
nas en un automóvil es 1 .33. 

Hipótesis alternativa Conclusión que se acepta cuando se 
demuestra que la hipótesis nula es falsa. También se denomina 
hipótesis de investigación. 

Hipótesis nula Declaración acerca del valor del parámetro 
poblacional, H 0 , que se compara para probar ante la evidencia 
numérica. 

Nivel de significancia Probabilidad de rechazar la hipótesis 
Proporción Fracción del porcentaje de una muestra o una 
población con una asimetría particular. Si a 5 de 50 en una mues- 
tra les gustó un nuevo cereal, la proporción es 5/50, o bien, 0.10. 
Prueba de dos colas Se emplea cuando la hipótesis alternati- 
va no indica una dirección, como /+,: |ju A 75, y se lee “la media 
poblacional no es igual a 75”. Existe una región de rechazo en 
cada cola. 

Prueba de hipótesis Procedimiento estadístico con base en 
evidencia muestral y teoría de la probabilidad, para determinar si 
es razonable la declaración acerca del parámetro poblacional. 
Prueba de una cola Se emplea cuando la hipótesis alternativa 
indica una dirección, como ^ > 40, y se lee “la media pobla- 
cional es mayor que 40”. En este caso la región de rechazo se 
encuentra sólo en una cola (la derecha). 

Valor crítico Valor que indica el punto de división entre la 
región donde la hipótesis nula no se rechaza y la región donde se 
rechaza. 

Valor p Probabilidad de calcular un valor del estadístico de 
prueba por lo menos tan extremo como el que se encuentra en 
los datos muéstrales cuando la hipótesis nula es verdadera. 

Capítulo 11 

Distribución t Investigada y reportada por William S. Gosset en 
1908 y publicada con el seudónimo Student. Es similar a la dis- 
tribución normal estándar que se presentó en el capítulo 7. Las 
características más importantes de t son: 


1 . Es una distribución continua. 

2. Puede adoptar valores entre menos infinito y más infinito. 

3. Es simétrica respecto de su media de cero. Sin embargo, 
está más dispersa y es más plana en el ápice que la distribu- 
ción normal estándar. 

4. Se aproxima a la distribución normal estándar cuando n 
aumenta. 

5. Existe una familia de distribuciones f. Existe una distribución 
t en una muestra de 15 observaciones, otra en 25, y así 
sucesivamente. 

Estimado conjunto de la varianza de la población Promedio 
ponderado de s 2 y s¡ para estimar la varianza común cr 2 , cuando 
se utilizan muestras pequeñas para probar la diferencia entre dos 
medias poblacionales. 

Muestras dependientes Las muestras dependientes se carac- 
terizan por una medición, después algún tipo de intervención, 
seguida por otra medición. Las muestras pareadas también son 
dependientes debido a que el mismo individuo o elemento es 
un miembro de las dos muestras. Ejemplo: diez participantes en 
un maratón se pesaron antes y después de competir en la carre- 
ra. Se desea estudiar la cantidad media de pérdida de peso. 
Muestras independientes Las muestras elegidas al azar no 
están relacionadas entre sí. Se desea estudiar la edad media de 
los presos en las prisiones de Auburn y Allegheny. Se selecciona 
una muestra de 28 internos de la prisión de Auburn y una mues- 
tra de 19 de la prisión de Allegheny. Una persona no puede estar 
encerrada en las dos prisiones. Las muestras son independien- 
tes, es decir, no se relacionan. 

Capítulo 12 

Análisis de la varianza (ANOVA) Técnica para probar de 
manera simultánea si son iguales las medias de varias poblacio- 
nes. Usa la distribución Fcomo la distribución del estadístico de 
prueba. 

Bloque Segunda fuente de variación, además de los tratamien- 
tos. 

Distribución F Sirve como el estadístico de prueba en los pro- 
blemas ANOVA y de otro tipo. Sus características principales 
son: 

1 . Nunca es negativa. 

2. Es una distribución continua que se aproxima al eje X, pero 
nunca lo toca. 

3. Tiene sesgo positivo. 

4. Se basa en dos conjuntos de grados de libertad. 

5. Al igual que la distribución f, hay una familia de distribuciones 
F. Existe una distribución con 17 grados de libertad en el nu- 
merador y 9 en el denominador, hay otra distribución F con 7 
grados de libertad en el numerador y 12 en el denominador, 
y así sucesivamente. 

Interacción Dos variables interactúan si el efecto que un factor 
tiene en la variable estudiada es diferente en distintos niveles del 
otro factor. 

Tratamiento Fuente de variación. Identifica las diversas pobla- 
ciones que están siendo examinadas. 


Problemas 
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Problemas 


En los problemas 1 a 8, establezca: a) las hipótesis nula y alternativa, b) la regla de decisión y c) la deci- 
sión respecto de la hipótesis nula, d) interprete el resultado. 

1 . Se calibra una máquina para fabricar pelotas de tenis de modo que el rebote medio sea de 36 pul- 
gadas cuando la pelota se deje caer desde una plataforma con una cierta altura. El supervisor sos- 
pecha que el rebote medio cambió y es menor que 36 pulgadas. Para comprobarlo, se dejaron 
caer 42 pelotas desde la plataforma y la altura media del rebote fue de 35.5 pulgadas, con una 
desviación estándar de 0.9 pulgadas. A un nivel de significancia de 0.05, ¿puede el supervisor con- 
cluir que la altura del rebote medio es menor que 36 pulgadas? 

2 . Una investigación del First Bank of Illinois reveló que 8% de sus clientes espera más de cinco 
minutos para hacer sus transacciones bancadas cuando no utiliza la ventanilla de autoservicio. La 
gerencia considera que esta demora es razonable y no pondrá más cajeros a menos que la pro- 
porción sea mayor a 8%. El gerente de la sucursal en la Litchfield Branch considera que, en su 
sucursal, la espera es mayor que la estándar, por lo cual solicitó cajeros de medio tiempo. Para 
respaldar su petición determinó que, en una muestra de 100 clientes, 10 esperaron más de cinco 
minutos. Con un nivel de significancia de 0.01 , ¿es razonable concluir que más del 8% de los clien- 
tes esperó más de cinco minutos? 

3 . Se suponía que los trabajadores de construcción de caminos no realizan un trabajo productivo 
durante un promedio de 20 minutos de cada hora. Algunos afirmaban que el tiempo no producti- 
vo era aún mayor. Se realizó un estudio en un emplazamiento de construcción, con un cronóme- 
tro y otras formas de verificación de hábitos de trabajo. Una verificación aleatoria de los tra- 
bajadores reveló los tiempos no productivos siguientes, en minutos, durante un periodo de una 
hora (sin incluir los descansos programados): m 


10 

25 

17 

20 

28 

30 

18 

23 

18 


A un nivel de significancia de 0.05, ¿es razonable concluir que el tiempo no productivo medio es 
mayor a 20 minutos? 

4 . Se va ha realizar una prueba que implica medir el poder de soporte medio de dos pegamentos 
para plástico. Primero se recubrió el extremo de un gancho pequeño con pegamento Epox y se 
sujetó a una hoja de plástico. Cuando se secó, se agregó peso al gancho hasta que se separó de 
la hoja de plástico. Se registró el peso. Este procedimiento se repitió hasta que se probaron 12 
ganchos. Se siguió el mismo procedimiento con el pegamento Holdtite, pero sólo se emplearon 
10 ganchos. Los resultados de las muestras, en libras, fueron: 



Epox 

Holdtite 

Media muestral 

250 

252 

Desviación estándar muestral 

5 

8 

Tamaño muestral 

12 

10 


A un nivel de significancia de 0.01, ¿hay alguna diferencia entre el poder de soporte medio del 
pegamento Epox y el del pegamento Holdtite? 

5 . Pittsburgh Paints desea probar un aditivo formulado para aumentar la vida de las pinturas emplea- 
das en condiciones calurosas y áridas del sureste de Estados Unidos. Se pintó la parte superior 
de una pieza de madera con la pintura normal, y en la parte inferior se usó pintura con el aditivo. 
Se siguió el mismo procedimiento con un total de 10 piezas. Después se sometió cada pieza a una 
luz brillante. Los datos, el número de horas que duró la pintura de cada pieza antes de desvane- 
cerse más allá de un cierto punto, son: 






Número de horas por muestra 





A 

B 

C 

D 

E 

F 

G 

H 

1 

J 

Sin aditivo 

325 

313 

320 

340 

318 

312 

319 

330 

333 

319 

Con aditivo 

323 

313 

326 

343 

310 

320 

313 

340 

330 

315 


Con el nivel de significancia de 0.05, determine si el aditivo es eficaz para prolongar la vida de la 
pintura. 

6. Un distribuidor de refresco de cola de Búfalo, en el estado de Nueva York, ofrece una oferta espe- 
cial en empaques de 12 unidades, y se pregunta en qué parte de las tiendas de comestibles se 
debe colocar el refresco para captar más la atención. ¿Se deberá colocar cerca de la puerta de 
acceso, en la sección de refrescos, en las cajas registradoras, o cerca de la leche y otros produc- 
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tos lácteos? Cuatro tiendas con ventas totales similares cooperaron en un experimento. En una 
tienda, los paquetes de 12 se colocaron cerca de la puerta de acceso; en otro, cerca de las cajas 
registradoras, y así sucesivamente. Las ventas se verificaron a horas específicas en cada tienda 
durante exactamente cuatro minutos. Los resultados son: 


Cerca de la puerta 

En la sección 
de refrescos 

Cerca de las cajas 
registradoras 

En la sección 
de lácteos 

$6 

$ 5 

$7 

$10 

8 

10 

10 

9 

3 

12 

9 

6 

7 

4 

4 

11 


9 

5 




7 



El distribuidor desea determinar si hay alguna diferencia entre las ventas medias del refresco en 
las cuatro ubicaciones de la tienda. Utilice el nivel de significancia de 0.05. 

7. La Williams Corporation investiga ios efectos de ios antecedentes escolares en el desempeño de 
los empleados. Una variable importante en este caso es el estado social autodefinido del emplea- 
do. La compañía registró los volúmenes de ventas anuales (en miles de dólares) logrados por los 
empleados de ventas en cada una de las categorías siguientes. Realice un análisis completo de 
varianza de dos vías (con la posibilidad de interacciones) con los datos y describa qué sugieren 
sus resultados. ^ 


Estado social autodefinido 

Tipo de escuela 


De las 8 mejores 

De gobierno 

Privada pequeña 

Bajo 

62,61 

68,64 

70, 70 

Medio 

68,64 

74, 68 

62, 65 

Alto 

70,71 

57,60 

57, 56 


8. Un supervisor de escuela revisa los salarios iniciales de antiguos estudiantes (en miles de dólares). 
Se tomaron muestras durante tres años de cuatro especialidades (contabilidad, administración, 
finanzas y marketing). 


Especialidad/año 

2003 

2004 

2005 

Contabilidad 

75.4, 69.8, 62.3 

73.9, 78.8, 62.0 

64.2, 80.8, 68.2 

Administración 

61.5, 59.9, 62.1 

63.9, 57.6, 66.5 

74.2, 67.5, 58.1 

Finanzas 

63.6, 70.2, 72.2 

69.2, 72.5, 67.2 

74.7, 66.4, 77.9 

Marketing 

71.3, 69.2, 66.4 

74.0, 67.6, 61.7 

60.0, 61.3, 62.5 


a) La siguiente es una gráfica de interacción de la información. ¿Qué revela la gráfica? 


Gráfica de interacción (medias muéstrales) para los salarios 



Especialidad 

• 

Contabilidad 

|| - • 

Administración 


Finanzas 

n 

Marketing 


Año 


Test de práctica 
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ib) Escriba todos los pares de hipótesis nula y alternativa que aplicaría en una prueba ANOVA de 
dos vías. 

c) La siguiente es la captura de pantalla de un software estadístico. Utilice el nivel de significan- 
cia de 0.05 para verificar interacciones. 


Fuente 

DF 

SS 

MS 

F 

P 

Especialidad 

3 

329.20 

109 . 732 

3.39 

0 . 034 

Año 

2 

7.32 

3.659 

0 . 11 

0 . 894 

Interacción 

6 

183 . 57 

30.595 

0.94 

0.482 

Error 

24 

777.29 

32.387 



Total 

35 

1297.37 





d) Si lo considera adecuado, pruebe otras hipótesis con un nivel de significancia de 0.05. Si no es 
adecuado, describa por qué no debe hacer las pruebas. 


Casos 


A. Century National Bank 

Consulte la descripción del Century National Bank al final del 
repaso de los capítulos 1 a 4, en la página 141. 

Con muchas opciones disponibles, los clientes ya no dejan 
que su dinero permanezca en una cuenta de cheques. Durante 
muchos años, el saldo medio de una cuenta de cheques fue de 
$1 600. ¿Indican los datos muéstrales que el valor del saldo 
medio de la cuenta disminuyó a niveles inferiores de este valor? 

En años recientes también se observó un aumento del uso 
de cajeros automáticos. Cuando el señor Selig asumió la respon- 
sabilidad del banco, el número medio de transacciones mensua- 
les por cliente eran 8; ahora él cree que aumentó a más de 10. En 
realidad, a la agencia de publicidad que prepara comerciales de 
televisión para el banco le gustaría usar este dato en el nuevo 
comercial que diseña. ¿Hay evidencia suficiente para concluir 
que el número medio de transacciones por cliente es mayor a 10 
por mes? ¿Puede afirmar la agencia de publicidad que la media 
es mayor de 9 al mes? 

El banco tiene sucursales en cuatro ciudades distintas: Cin- 
cinnati, Ohio; Atlanta, Georgia; Louisville, Kentucky, y Erie, Penn- 
sylvania. Al señor Selig le gustaría saber si hay alguna diferencia 
entre los saldos medios de las cuentas de cheques de las cuatro 
sucursales. Si hay diferencias, ¿en cuáles sucursales se presen- 
tan? 

El señor Selig también tiene interés en los cajeros automáti- 
cos del banco. ¿Hay alguna diferencia en el uso de los cajeros 
automáticos de las sucursales? Asimismo, ¿los clientes que po- 
seen tarjetas de débito tienden a usar cajeros automáticos en 
forma distinta de los que no las tienen? ¿Hay alguna diferencia 
en el uso de los cajeros automáticos por parte de quienes tienen 
cuentas de cheques que pagan interés en comparación con las 
que no lo pagan? Prepare un reporte para el señor Selig que res- 
ponda estas preguntas. 

B. Bell Grove Medical Center 

La señora Gene Dempsey es gerente del centro de atención de 
emergencia del Bell Grove Medical Center. Una de sus responsa- 


bilidades es tener enfermeras suficientes para que se atienda con 
prontitud a los pacientes. Es muy estresante para los pacientes 
esperar mucho para recibir atención de emergencia, aunque sus 
necesidades no sean de vida o muerte. La señora Dempsey reu- 
nió la información siguiente respecto del número de pacientes 
durante las últimas semanas. El centro no atiende los fines de 
semana. ¿Da la impresión de que hay algunas diferencias en el 
número de pacientes atendidos el día final de la semana? Si hay 
diferencias, ¿cuáles días parecen ser los más ocupados? Redac- 
te un breve reporte que resuma sus hallazgos. 


Fecha 

Día 

Pacientes 

29-9-06 

Lunes 

38 

30-9-06 

Martes 

28 

1-10-06 

Miércoles 

28 

2-10-06 

Jueves 

30 

3-10-06 

Viernes 

35 

6-10-06 

Lunes 

35 

7-10-06 

Martes 

25 

8-10-06 

Miércoles 

22 

9-10-06 

Jueves 

21 

10-10-06 

Viernes 

32 

13-10-06 

Lunes 

37 

14-10-06 

Martes 

29 

15-10-06 

Miércoles 

27 

16-10-06 

Jueves 

28 

17-10-06 

Viernes 

35 

20-10-06 

Lunes 

37 

21-10-06 

Martes 

26 

22-10-06 

Miércoles 

28 

23-10-06 

Jueves 

23 

24-10-06 

Viernes 

33 


Test de práctica 

Parte 1 : Objetivo 

1. Una afirmación sobre el valor de un parámetro poblacional que siempre incluye el signo de igual se llama _ 

1 . 

2. La probabilidad de rechazar una hipótesis verdaderamente nula se denomina 2. 
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3. Cuando se realiza una prueba de hipótesis con respecto a la proporción de una población, el valor mr debe ser cuando 

menos 3 

4. Cuando se realiza una prueba de hipótesis con respecto a una sola media poblacional, se utiliza la distribución z como prueba 

estadística sólo cuando no se conoce 4 

5. En una prueba de hipótesis de dos muestras de medias, donde las desviaciones estándares de la población son desconocidas, 

¿qué debemos asumir con respecto a la forma de las poblaciones? 5 

6. Un valor calculado a partir de información muestral que se utiliza para determinar si debemos rechazar la hipótesis nula se cono- 
ce como 6. 

7. En una prueba de dos colas, la región de rechazo está (Toda en la cola superior, toda en la cola inferior, distribuida 

uniformemente entre ambas colas, o ninguna de las anteriores: elija una respuesta.) 7 

8. ¿Cuál de las siguientes no es una característica de la distribución F? (Continua, con sesgo positivo, rango de — oo a oo, familia 

de distribuciones.) 8 

9. Para realizar una ANOVA de una vía, los tratamientos deben ser (Independientes, mutuamente excluyentes, conti- 
nuos.) 9 

10. En una ANOVA de dos vías hay cuatro tratamientos y seis observaciones en cada tratamiento. ¿Cuáles son los grados de liber- 
tad de la distribución F? 10 

Parte 2: Problemas 

En el caso de los problemas 1 y 2, establezca las hipótesis nula y alternativa y la regla de decisión, tome una decisión con respecto 

a la hipótesis nula, e interprete el resultado. 

1. El administrador del Fort Fisher State Park, de Carolina del Norte, piensa que el típico visitante de verano pasa en el parque más 
de 90 minutos. Una muestra de 18 visitantes durante los meses de junio, julio y agosto de 2008 reveló que el tiempo medio que 
los visitantes permanecían en el parque era de 96 minutos, con una desviación estándar de 12 minutos. A un nivel de significan- 
cia de 0.01, ¿es razonable concluir que el tiempo medio de permanencia en el parque es mayor a 90 minutos? 

2. ¿Existe alguna diferencia entre las millas promedio recorridas por semana de cada una de las dos compañías de taxis que ope- 
ran en el área de Grand Strand? El periódico local Sun News investigó y obtuvo la siguiente información muestral. A un nivel de 
significancia de 0.05, ¿es razonable concluir que hay una diferencia entre las millas promedio recorridas? Asuma que las varian- 
zas de población son iguales. 


Variable 

Yellow Cab 

Horse and Buggy 
Cab Company 

Millas promedio 

837 

797 

Desviación estándar 

30 

40 

Tamaño de la muestra 

14 

12 


3. A continuación se reportan los resultados de una ANOVA de una vía. Utilice un nivel de significancia de 0.05. 


ANOVA 

Fuente de variación 

SS 

gi 

MS 

F 

Entre grupos 

6.892202 

2 

3.446101 

4.960047 

Dentro de los grupos 

12.50589 

18 

0.694772 


Total 

19.3981 

20 




Responda las siguientes preguntas. 

a) ¿Cuántos tratamientos hay en el estudio? 

b) ¿Cuál es el tamaño total de la muestra? 

c) ¿Cuál es el valor crítico de F? 

d) Escriba la hipótesis nula y la hipótesis alternativa. 

e) ¿Cuál es su decisión con respecto a la hipótesis nula? 

f ) ¿Podemos concluir que las medias de tratamiento son diferentes? 



1 

Regresión lineal 
y correlación 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



En el ejercicio 61 se enumeran las películas con los mayores ingresos 
mundiales y su presupuesto mundial. Determine la correlación entre 
presupuesto mundial e Ingresos mundiales. Comente la asociación 
entre las dos variables (vea ejercicio 61 y objetivo 2). 


OA1 Definir los términos 
variable dependiente e 
independiente. 

OA2 Calcular, probare 
interpretar la relación entre 
dos variables utilizando el 
coeficiente de correlación. 

OA3 Aplicar un análisis de 
regresión para estimar la 
relación lineal entre dos 
variables. 

OA4 Interpretar el análisis de 
regresión. 

OA5 Evaluar la significancia 
de la pendiente de la ecuación 
de regresión. 

OA6 Evaluar una ecuación de 
regresión para predecir la 
variable dependiente. 

OA7 Calculare interpretar el 
coeficiente de determinación. 


OA8 Calcular e interpretar los 
intervalos de confianza y de 
predicción. 
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CAPÍTULO 13 Regresión lineal y correlación 


13.1 Introducción 




Estadística en acción 

El transbordador espacial 
Challenger explotó el 28 
de enero de 1986. Una 
investigación para deter- 
minar la causa examinó a 
cuatro contratistas: 
Rockwell International, 
responsable del transbor- 
dador y motores, 
Lockheed Martin, del 
apoyo terrestre, Martin 
Marietta de los tanques 
de combustible externos, 
y Morton Thiokol de los 
cohetes aceleradores de 
combustible sólido. 


En los capítulos 2 a 4 abordamos la estadística descriptiva. Los datos sin pro- 
cesar se organizaron en una distribución de frecuencias, y se calcularon varias 
medidas de ubicación y de dispersión para describir las características impor- 
tantes de la distribución. En los capítulos 5 a 7 describimos la probabilidad 
y creamos distribuciones de probabilidad a partir de enunciados de probabili- 
dad. En el capítulo 8 se inició el estudio de la inferencia estadística, donde 
recolectamos una muestra para estimar un parámetro poblacional como la 
media poblacional o la proporción de la población. Además, utilizamos los 
datos de la muestra para probar una inferencia o hipótesis acerca de una 
media poblacional o una proporción poblacional, la diferencia entre dos me- 
dias poblacionales, o si varias medias poblacionales eran iguales. Todas estas 
pruebas implicaron sólo una variable de intervalo (o de razón), como la ganan- 
cia que se obtiene por la venta de un auto, el ingreso de los presidentes de un 
banco o el número de pacientes admitidos cada mes en un hospital. 

En este capítulo, el foco de interés cambia hacia el estudio de la relación 
entre dos variables de intervalo (o de razón). En todos los campos de nego- 
cios, identificar y estudiar las relaciones entre variables puede proporcionar 
información sobre las formas de elevar las ganancias, métodos para reducir 
los costos o variables para predecir la demanda. Para comercializar sus productos, muchas 
empresas reducen sus precios a través de cupones y descuentos para aumentar sus ventas. 
En este ejemplo, nos interesa la relación entre dos variables: la reducción de precios y las ven- 
tas. Para recabar datos, una compañía puede probar en el mercado una variedad de métodos 
de reducción de precios y observar el comportamiento de las ventas. En economía, usted 
encontrará muchas relaciones entre ambas variables que constituyen la base de la economía, 
tales como abastecimiento y demanda, y demanda y precio. 

A manera de otro ejemplo familiar, recuerde que en la sección 4-6 del capítulo 4 utiliza- 
mos los datos del Applewood Auto Group para mostrar la relación entre dos variables con un 
diagrama de dispersión. Se gráfico la ganancia por vehículo en el eje vertical y la edad del 
comprador en el eje horizontal. Vea la captura de pantalla del software estadístico en la pági- 
na 125. En ese diagrama se observó que, a medida que aumentaba la edad del comprador, la 
ganancia por vehículo también se incrementaba. 

Otros ejemplos de relaciones entre dos variables son: 

• ¿Existe alguna relación entre la cantidad que Healthtex gasta por mes en publicidad y sus 
ventas mensuales? 

• ¿El número de metros cuadrados en una casa está relacionado con el costo de calefac- 
ción de esa casa en enero? 

• En un estudio de eficiencia de combustible, ¿existe una relación entre las millas por galón 
y el peso del auto? 

• ¿Hay alguna relación entre el número de horas que estudiaron los alumnos para un exa- 
men y la calificación que obtuvieron? 


Después de varios meses, 
en la investigación se 
determinó responsable 
de la explosión a los 
empaques en forma de 
“O” producidos por 
Morton Thiokol. Un 
estudio de los precios de 
las acciones del contratis- 
(■ continúa ) 


En este capítulo se amplía esta idea. Es decir, se desarrollan medidas numéricas para 
expresar la relación entre dos variables. ¿Es fuerte o débil la relación, o es directa o inversa? 
Además, se desarrolla una ecuación para expresar la relación entre variables, lo que permite 
estimar una variable con base en otra. 

Para comenzar el estudio de las relaciones entre ambas variables, se examinan el signifi- 
cado y el propósito de un análisis de correlación. Continuamos con el desarrollo de una 
ecuación matemática que permita estimar el valor de una variable con base en el valor de otra, 
procedimiento que se conoce como análisis de regresión. También se evaluará la capacidad 
de la ecuación para hacer estimaciones correctas. 



13.2 ¿Qué es el análisis de correlación? 
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ta reveló algo interesante. 
En el día del accidente, 
los títulos de Morton 
Thiokol bajaron 11.86% y 
mientras que las de los 
otros tres contratistas sólo 
perdieron de 2 a 3%. ¿Es 
posible concluir que en 
los mercados financieros 
se anticipó el resultado de 
la investigación? 


13.2 ¿Qué es el análisis de correlación? 

Cuando se estudia la relación entre dos variables en escala de intervalo (o de razón), es usual 
comenzar con un diagrama de dispersión. Este procedimiento proporciona una representación 
visual de la relación entre las variables. El siguiente paso suele ser calcular el coeficiente de 
correlación, que brinda una medida cuantitativa de la fuerza de la relación entre dos variables. 
Como ejemplo, suponga que el gerente de ventas de Copier Sales of America, que tiene una 
fuerza de ventas muy grande en Estados Unidos y Canadá, desea determinar si hay alguna 
relación entre el número de llamadas de ventas en un mes y el número de copiadoras que se 
vendieron en él. El gerente selecciona una muestra aleatoria de 10 representantes de ventas y 
determina el número de llamadas de ventas que cada uno hizo el mes pasado y el número de 
copiadoras que vendió. La información muestral aparece en la tabla 13-1. 


TABLA 13-1 Número de llamadas de ventas y copiadoras vendidas por cada empleado 


Representante 
de ventas 

Número de 
llamadas de ventas 

Número de 
copiadoras vendidas 

Tom Keller 

20 

30 

Jeff Hall 

40 

60 

Brian Virost 

20 

40 

Greg Fish 

30 

60 

Susan Welch 

10 

30 

Carlos Ramírez 

10 

40 

Rlch Niles 

20 

40 

Mlke Kiel 

20 

50 

Mark Reynolds 

20 

30 

Soni Jones 

30 

70 


Al revisar los datos se observa que parece haber una relación entre el número de llama- 
das de ventas y el número de unidades vendidas. Es decir, los vendedores que hicieron más 
llamadas de venta vendieron más unidades. Sin embargo, la relación no es “perfecta” o exac- 
ta. Por ejemplo, Soni Jones hizo menos llamadas de ventas que Jeff Hall, pero vendió más uni- 
dades. 

Además de las técnicas de graficado expuestas en el capítulo 4, desarrollaremos medi- 
ciones numéricas para representar de manera más precisa la relación entre ambas variables: 
llamadas de ventas y copiadoras vendidas. Este grupo de técnicas estadísticas se denomina 

análisis de correlación. 


0 


ANÁLISIS DE CORRELACIÓN Grupo de técnicas para medir la asociación entre dos variables 


J 


La idea básica del análisis de correlación es reportar la asociación entre dos variables. Por 
lo general, el primer paso es trazar los datos en un diagrama de dispersión. Un ejemplo ilus- 
trará cómo se emplea un diagrama de dispersión. 


Cjemplo 


Copier Sales of America vende copiadoras a empresas de todos los tamaños en Estados 
Unidos y Canadá. Hace poco ascendieron a la señora Marcy Bancer al puesto de gerente 
nacional de ventas. A la siguiente junta de ventas asistirán los representantes de ventas de todo 
el país. Ella desea destacar la importancia de hacer una última llamada de ventas adicional 
cada día, y decide reunir información sobre la relación entre el número de llamadas de ventas 
y el número de copiadoras vendidas. Por ello, selecciona una muestra aleatoria de 10 repre- 
sentantes y determina el número de llamadas que hicieron el mes pasado y el número de copia- 
doras que vendieron. La información muestral se reporta en la tabla 13-1 ¿Qué observaciones 
cabe hacer respecto de la relación entre el número de llamadas de ventas y el número de copia- 
doras vendidas? Elabore un diagrama de dispersión para representar la información. 
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Solución 


OA1 Definir los 
términos variable 
dependiente e 
independiente. 


Con base en la información de la tabla 13-1, la señora Bancer sospecha que hay una relación 
entre el número de llamadas de venta hechas en un mes y el número de copiadoras vendidas. 
Soni Jones vendió más copiadoras el mes anterior, y fue una de las tres representantes que 
hicieron 30 llamadas o más. Por otro lado, Susan Welch y Carlos Ramírez sólo hicieron 10 lla- 
madas de ventas durante el mes anterior. La señora Welch, junto con otros dos, tuvo el núme- 
ro menor de copiadoras vendidas entre los representantes muestreados. 

La implicación es que el número de copiadoras vendidas se relaciona con el número de 
llamadas de ventas. Conforme aumenta el número de llamadas de venta, parece que el núme- 
ro de copiadoras vendidas también lo hace. De este modo, el número de llamadas de ventas 
se considera variable independiente, y el de copiadoras vendidas, variable dependiente. 

La variable independiente proporciona la base para la estimación. Es la variable predicto- 
ra. Por ejemplo, digamos que se desea predecir el número esperado de copiadoras que se ven- 
derán si un representante realiza 20 llamadas de ventas. Observe que elegimos este valor. La 
variable independiente no es un número aleatorio. 

La variable dependiente es la variable que se desea predecir o estimar. También puede ser 
descrita como el resultado de un valor conocido de la variable independiente. La variable 
dependiente es aleatoria, esto es, por cada valor dado a la variable independiente, existen 
muchos posibles resultados para la variable dependiente. En este ejemplo, note que cinco 
representantes de ventas hicieron 20 llamadas de ventas. El resultado de realizar esta cantidad 
de llamadas se traduce en tres valores distintos de variable dependiente. 

Es práctica común situar la variable dependiente (copiadoras vendidas) en el eje vertical o 
V y la variable independiente (número de llamadas de ventas) en el eje horizontal o X. Para ela- 
borar un diagrama de dispersión de la información de Copier Sales of America, inicie con el pri- 
mer representante de ventas, Tom Keller, quien hizo 20 llamadas el mes anterior y vendió 30 
copiadoras, por lo cual X = 20 y Y = 30. Para trazar esta información, a partir del origen vaya 
por el eje horizontal hasta el valor X = 20, después haga lo mismo en el eje vertical hasta Y = 
30 y marque un punto en la intersección. Continúe este proceso hasta que trace todos los 
datos pareados, como se muestra en la gráfica 13-1. 
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GRÁFICA 13-1 


Diagrama de dispersión que representa las llamadas de ventas y las copiadoras 
vendidas 




El diagrama de dispersión muestra en forma gráfica que los representantes que hacen más 
llamadas tienden a vender más copiadoras. Es razonable que la señora Bancer, gerente nacio- 
nal de ventas en Copier Sales of America, diga a sus vendedores que, entre más llamadas de 
ventas hagan, se espera que vendan más copiadoras. Observe que, aunque parece haber una 
relación positiva entre las dos variables, no todos los puntos se encuentran en una recta. En la 
siguiente sección se miden la fuerza y la dirección de esta relación entre dos variables, para 
determinar el coeficiente de correlación. 



13.3 Coeficiente de correlación 
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13.3 Coeficiente de correlación 


OA2 Calcular, probar e 
interpretar la relación entre 
dos variables utilizando el 
coeficiente de correlación. 


El coeficiente de correlación, creado por Karl Pearson alrededor de 1900, describe la fuerza 
de la relación entre dos conjuntos de variables en escala de intervalo o de razón. Se designa 
con la letra r, y con frecuencia se le conoce como r de Pearson y coeficiente de correlación 
producto-momento. Puede adoptar cualquier valor de -1 .00 a +1 .00, inclusive. Un coeficien- 
te de correlación de -1.00 o bien de +1.00 indica una correlación perfecta. Por ejemplo, un 
coeficiente de correlación para el caso anterior calculado a +1 .00 Indicaría que el número de 
llamadas de ventas y la cantidad de copiadoras que vende cada representante están perfec- 
tamente relacionados en un sentido lineal positivo. Un valor calculado de —1 .00 revela que las 
llamadas de ventas y el número de copiadoras vendidas están perfectamente relacionados en 
un sentido lineal Inverso. En la gráfica 13-2 se muestra cómo aparecería el diagrama de dis- 
persión si la relación entre los dos conjuntos de datos fuera lineal y perfecta. 



GRAFICA 13-2 Diagramas de dispersión con correlación negativa perfecta y correlación positiva 
perfecta 


Si no hay ninguna relación entre los dos conjuntos de variables, la r de Pearson es cero. 
Un coeficiente de correlación r cercano a 0 (sea 0.08) indica que la relación lineal es muy débil. 
Se llega a la misma conclusión si r = -0.08. Los coeficientes de -0.91 y + 0.91 tienen una 
fuerza igual; los dos indican una correlación muy fuerte entre las dos variables. Por lo tanto, la 
fuerza de la correlación no depende de la dirección (ya sea - o bien +). 

En la gráfica 1 3-3 se muestran los diagramas de dispersión cuando r = 0, una r débil (sea 
-0.23), y una r fuerte (sea +0.87). Observe que, si la correlación es débil, se presenta una dis- 
persión considerable respecto de la recta trazada a través del centro de los datos. En el dia- 
grama de dispersión que representa una fuerte relación, hay muy poca dispersión respecto de 
la recta. Esto Indica, en el ejemplo que se muestra en la gráfica, que las horas estudiadas 
constituyen un factor de pronóstico de la calificación en el examen. 

En el siguiente diagrama se resumen la fuerza y la dirección del coeficiente de correlación. 
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Ejemplos de grados de corre- 
lación. 



GRAFICA 13-3 Diag ramas de dispersión que representan una correlación cero, débil y fuerte 


COEFICIENTE DE CORRELACIÓN Medida de la fuerza de la relación lineal entre dos variables. 




Las características del coeficiente de correlación se resumen a continuación. 


í ' i \ 

CARACTERISTICAS DEL COEFICIENTE DE CORRELACION 

1. El coeficiente de correlación de la muestra se identifica con la letra minúscula r. 

2. Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala de 
intervalo o en escala de razón. 

3. Varia de -1 hasta +1, inclusive. 

4. Un valor cercano a 0 indica que hay poca asociación entre las variables. 

5. Un valor cercano a 1 indica una asociación directa o positiva entre las variables. 

6. Un valor cercano a -1 indica una asociación inversa o negativa entre las variables. 

V J 


¿Cómo se determina el coeficiente de correlación? Como ejemplo, emplee los datos de 
Copier Sales of America, que se reportan en la tabla 13-2. Inicie con un diagrama de disper- 

TABLA 13-2 Llamadas de ventas y copiadoras vendidas de 10 vendedores 


Llamadas Copiadoras 
de ventas vendidas 

Representantes de ventas ( X ) (Y) 


Tom Keller 

20 

30 

Jeff Hall 

40 

60 

Brian Virast 

20 

40 

Greg Fish 

30 

60 

Susan Welch 

10 

30 

Carlos Ramírez 

10 

40 

Rich Niles 

20 

40 

Mike Kiel 

20 

50 

Mark Reynolds 

20 

30 

Soni Jones 

30 

70 

Total 

220 

450 


13.3 Coeficiente de correlación 
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sión, similar a la gráfica 13-2. Se traza una recta vertical con los valores de datos en la media 
de los valores X y una recta horizontal en la media de los valores Y. En la gráfica 1 3-4 se agre- 
gó una recta en 22.0 llamadas (X = 2X/n = 220/1 0 = 22) y una recta horizontal en 45.0 copia- 
doras ( Y — Y,Y/n = 450/10 = 45.0). Estas rectas pasan por el “centro” de los datos y dividen 
el diagrama de dispersión en cuatro cuadrantes. Considere mover el origen de (0, 0) a (22, 45). 
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13-4 Cálculo del coeficiente de correlación 


Dos variables tienen una relación positiva cuando el número de copiadoras vendidas está 
por arriba de la media y el número de llamadas de ventas también se encuentra arriba de la 
media. Estos puntos aparecen en el cuadrante superior derecho (cuadrante I) de la gráfica 
13-4. De manera similar, cuando el número de copiadoras vendidas es menor que la media, 
también lo es el número de llamadas de ventas. Estos puntos se encuentran en el cuadrante 
inferior izquierdo de la gráfica 13-4 (cuadrante III). Por ejemplo, la última persona de la lista de 
la tabla 13-2, Soni Jones, hizo 30 llamadas de ventas y vendió 70 copiadoras. Estos valores 
se encuentran arriba de sus medias respectivas, por lo que este punto se ubica en el cuadran- 
te I, que es el cuadrante superior derecho. Soni hizo 8 (X — X = 30 - 22) más llamadas de 
ventas que la media y vendió 25 (Y - Y = 70 — 45) más copiadoras que la media. Tom Keller, 
el primer nombre de la lista de la tabla 13-2, hizo 20 llamadas y vendió 30 copiadoras. Ambos 
valores son menores que sus respectivas medias, por lo que este punto se ubica en el cua- 
drante inferior derecho. Tom hizo 2 llamadas menos y vendió 15 copiadoras menos que las 
medias respectivas. Las desviaciones del número medio de llamadas de ventas y del número 
medio de copiadoras vendidas de los 10 representantes de ventas se resumen en la tabla 
13-3. La suma de los productos de las desviaciones de las medias respectivas es 900. Es 
decir, el término 2(X - X)(Y — Y) = 900. 

En los cuadrantes superior derecho e inferior izquierdo, el producto de (X - X)(Y - Y) es 
positivo debido a que los dos factores tienen el mismo signo. En el ejemplo, esto sucede con 


TABLA 13-3 Desviaciones de la media y sus productos 


Representante de ventas 

Llamadas, X 

Ventas, Y 

X- X 

Y— Y 

(X-X)(Y- Y) 

Tom Keller 

20 

30 

-2 

-15 

30 

Jeff Hall 

40 

60 

18 

15 

270 

Brian Virost 

20 

40 

— 2 

-5 

10 

Greg Fish 

30 

60 

8 

15 

120 

Susan Welch 

10 

30 

-12 

-15 

180 

Carlos Ramírez 

10 

40 

-12 

-5 

60 

Rich Niles 

20 

40 

-2 

-5 

10 

Mike Kiel 

20 

50 

-2 

5 

-10 

Mark Reynolds 

20 

30 

-2 

-15 

30 

Soni Jones 

30 

70 

8 

25 

200 






900 
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todos los representantes, excepto Mike Kiel. Por lo tanto, se espera que el coeficiente de 
correlación tenga un valor positivo. 

Si las dos variables tienen una relación Inversa, una variable estará arriba y la otra debajo 
de la media. En este caso, la mayoría de los puntos se ubican en los cuadrantes superior izquier- 
do e Inferior derecho, es decir, en los cuadrantes II y IV. Ahora (X - X) y (Y — Y) tendrán signos 
opuestos, y su producto será negativo. El coeficiente de correlación resultante es negativo. 

¿Qué sucede si no hay una relación lineal entre las dos variables? Los puntos en el dia- 
grama de dispersión aparecerán en los cuatro cuadrantes. Los productos negativos de 
(X - X)(Y - Y) equilibran los productos positivos, por lo cual la suma es cero. Esto lleva al 
coeficiente de correlación cercano a cero. De esta manera, el término 2(X - X)(Y - Y), con- 
duce la fuerza y el signo de la relación entre las dos variables. 

Es necesario también que el coeficiente de correlación no sea afectado por las unidades 
de las dos variables. Por ejemplo, si se hubieran empleado cientos de copiadoras vendidas en 
lugar del número vendido, el coeficiente de correlación sería el mismo. El coeficiente de corre- 
lación es Independiente de la escala empleada si se divide el término 2(X - X)(Y — Y) entre 
las desviaciones estándares muéstrales. También se independiza del tamaño muestral y es 
acotado por los valores +1.00 y -1.00 si se divide entre (n — 1). 

Este razonamiento conduce a la siguiente fórmula: 


COEFICIENTE DE CORRELACIÓN 


S(X - X)(V - Y) 
(n - 1)s x s y 


( 13 - 1 ) 


y 


Para calcular el coeficiente de correlación, se utilizan las desviaciones estándares de la 
muestra de 10 llamadas de ventas y 10 copiadoras vendidas. Se puede emplear la fórmula 
(3-12) para calcular las desviaciones estándares muéstrales o un paquete de software estadís- 
tico. Para los comandos específicos en Excel y Minitab vea la sección Comandos de softwa- 
re al final del capítulo 3. La siguiente es la captura de pantalla de Excel. La desviación estándar 
del número de llamadas de ventas es 9.189, y del número de copiadoras vendidas, 14.337. 


Gónum 1 dstats [Compatibility Mode) 


A > I C 1 P I f g M I 

1 
2 

3 

4 
J 
6 

7 

8 

9 

10 
11 
12 

13 

14 

15 


Cálts 

Siles 

20 

30 

40 

60 

20 

40 

30 

60 

10 

30 

10 

40 

20 

40 

20 

50 

20 

30 

30 

70 




coa i 


Soles 


Mein 22.000 
Sttndird Error 2-906 
Medtin 20.000 
Mode 20.000 

Simple Vinince 84.444 
Kurtosls 0.396 
Sfcewness 0.601 
fUn«t 30000 
Mínimum 10.000 
Máximum 40.000 
5um 220.000 
Count 10.000 


Mein 45.000 
Stindárd Error 4.534 
Medien 40.000 
Modo 30.000 

Simple Vártánc* 208.596 
Kurtosls -1.001 
Slitwntss 0.566 
(Unge 40.000 
Mínimum 30.000 
Máximum 70.000 
Sum 450.000 
Count 10.000 


Ahora se sustituyen estos valores en la fórmula (13-1) para determinar el coeficiente de 
correlación: 


S(X - X)(Y - Y) 
( n ~ 1)s*s y 


900 

(10 - 1)(9.189)(1 4.337) 


0.759 


¿Cómo se interpreta una correlación de 0.759? Primero, es positiva, por lo que se obser- 
va una relación directa entre el número de llamadas de ventas y el número de copiadoras ven- 
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didas. Esto confirma el razonamiento basado en el diagrama de dispersión, gráfica 13-4. El 
valor de 0.759 está muy cercano a 1 .00, y por ende se concluye que la asociación es fuerte. 

Debe tener mucho cuidado con la interpretación. La correlación de 0.759 indica una aso- 
ciación positiva fuerte entre las variables. La señora Bancer acierta al motivar al personal de 
ventas para hacer llamadas adicionales, debido a que el número de llamadas se relaciona con 
el número de copiadoras que vende. Sin embargo, ¿más llamadas de ventas ocasionan más 
ventas? No, aquí no se ha demostrado la causa y el efecto, sólo que hay una relación entre las 
dos variables, llamadas de ventas y copiadoras vendidas. 

Si hay una relación fuerte (sea 0.91) entre dos variables, es factible suponer que un 
aumento o una disminución en una variable causa un cambio en la otra. Por ejemplo, se puede 
demostrar que el consumo de cacahuates de Georgia y el consumo de aspirina tienen una 
correlación fuerte. Sin embargo, esto no indica que un aumento del consumo de cacahuates 
hizo crecer el consumo de aspirina. De igual forma, los ingresos de profesores y el número de 
pacientes en instituciones psiquiátricas han aumentado en forma proporcional. Además, a 
medida que disminuye la población de burros, aumenta el número de grados doctorales otor- 
gados. Las relaciones de este tipo se denominan correlaciones espurias. Lo que se puede 
concluir cuando se tienen dos variables con fuerte correlación es que hay una relación o aso- 
ciación entre ambas variables, no que un cambio en una ocasiona un cambio en la otra. 



El departamento de mercadotecnia de Applewood Auto Group piensa que los compradores 
más jóvenes adquieren vehículos que rinden menos ganancias, contrario a lo que sucede en el 
caso de los compradores mayores. Quisiera usar esta información como parte de una próxima 
campaña de publicidad, para tratar de atraer a compradores mayores y obtener así más ganan- 
cias. Desarrolle un diagrama de dispersión que refleje la relación entre la ganancia que genera 
cada vehículo y la edad del comprador. Utilice un software estadístico para determinar el coe- 
ficiente de correlación. ¿Será éste un elemento útil para la publicidad? 

Utilizando el ejemplo de Applewood Auto Group, el primer paso es generar una gráfica de los 
datos mediante un diagrama de dispersión, tal como la que se muestra en la gráfica 13-5. 


Diagrama de dispersión de ganancia i/s. edad 



GRAFICA 13-5 Diag rama de dispersión de los datos de Applewood Auto Group 


El diagrama de dispersión sugiere que existe una posible relación entre la edad y la ganancia; 
sin embargo, no parece que esta relación sea fuerte. 

El siguiente paso es calcular el coeficiente de correlación para evaluar la fuerza relativa de 
la relación. El software estadístico proporciona una forma sencilla de calcular el valor del coe- 
ficiente de correlación, como se muestra en la siguiente captura de pantalla de Excel. 
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En el caso de estos datos, r = 0.262. Para evaluar la relación entre la edad del comprador 
y la ganancia que genera la venta de un auto: 

1. La relación es positiva o directa. ¿Por qué? Porque el signo del coeficiente de correlación 
es positivo. Esto confirma que a medida que aumenta la edad del comprador, se eleva 
también la ganancia que genera la venta del vehículo. 

2. La relación entre ambas variables es débil. En el caso de una relación positiva, los valores 
del coeficiente de correlación cercanos a uno indica relaciones más fuertes. En este caso, 
r = 0.262. Es más cercana a cero, y se observa que la relación no es muy fuerte. 

No se recomienda que Applewood utilice esta información como parte de una campaña 
de publicidad para atraer a compradores mayores que dejen mayores ganancias. 



Haverty’s Furniture es un negocio familiar que vende a clientes minoristas en el área de Chicago 
desde hace muchos años. Tanto en radio como en televisión e internet, la compañía destaca sus 
precios bajos y fáciles términos de crédito. El propietario desea analizar la relación entre las ventas 
y la suma de dinero que gastó en publicidad. A continuación se presenta la información de las ven- 
tas y de los gastos publicitarios durante los últimos cuatro meses. 


Mes 

Gastos publicitarios 
(en millones de dólares) 

Ingresos por ventas 
(en millones de dólares) 

Julio 

2 

7 

Agosto 

1 

3 

Septiembre 

3 

8 

Octubre 

4 

10 


a) El propietario desea pronosticar las ventas con base en los gastos publicitarios. ¿Cuál es la varia- 
ble dependiente? ¿Cuál es la variable independiente? 

b) Trace un diagrama de dispersión. 

c) Determine el coeficiente de correlación. 

d) Interprete la fuerza del coeficiente de correlación. 


ooimect 


Ejercicios 

1. Las siguientes observaciones muéstrales se seleccionaron de manera aleatoria. m 


X 4 5 3 6 10 

y 4 6 5 7 7 


Determine el coeficiente de correlación e interprete la relación entre X y Y. 
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2 . 


Las siguientes observaciones muéstrales se seleccionaron de manera aleatoria. 



X 

5 

3 

6 

3 

4 

4 

6 

8 

Y 

13 

15 

7 

12 

13 

11 

9 

5 


Determine el coeficiente de correlación e interprete la relación entre X y Y. 

3. Bi-lo Appliance Super-Store tiene tiendas en varias áreas metropolitanas de Nueva Inglaterra. El 
gerente general de ventas planea transmitir un comercial de una cámara digital en estaciones de 
televisión locales antes del periodo de ventas que empezará el sábado y terminará el domingo. 
Planea obtener la información de las ventas de la cámara digital durante el sábado y el domingo 
en las diversas tiendas y compararlas con el número de veces que se transmitió el anuncio en las 
estaciones de televisión. El propósito es determinar si hay alguna relación entre el número de 
veces que se transmitió el anuncio y las ventas de cámaras digitales. Los pares son: Sj J 


Ubicación de la 
estación de TV 

Número de 
trasmisiones 

Ventas de sábado a domingo 
(miles de dólares) 

Providence 

4 

15 

Springfield 

2 

8 

New Haven 

5 

21 

Boston 

6 

24 

Hartford 

3 

17 


a) ¿Cuál es la variable dependiente? 

b) Trace un diagrama de dispersión. 

c) Determine el coeficiente de correlación. 

d) Interprete estas medidas estadísticas. 

4. El departamento de producción de Centronics International desea explorar la relación entre el 
número de empleados que trabajan en una línea de ensamblado parcial y la cantidad de unidades 
producida. Como experimento, se asignó a dos empleados al ensamblado parcial. Su desempe- 
ño fue de 15 productos durante un periodo de una hora. Después, cuatro empleados hicieron los 
ensamblados y su número fue de 25 durante un periodo de una hora. El conjunto completo de 
observaciones pareadas se muestra a continuación. ^ A 


Número de 
ensambladores 

Producción 
en una hora 
(unidades) 

2 

15 

4 

25 

1 

10 

5 

40 

3 

30 


La variable dependiente es la producción; es decir, se supone que el nivel de producción depen- 
de del número de empleados. 

a) Trace un diagrama de dispersión. 

b) Con base en el diagrama de dispersión, ¿parece haber alguna relación entre el número de 
ensambladores y la producción? Explique. 

c) Calcule el coeficiente de correlación. 

5. El consejo de la ciudad de Pine Bluffs considera aumentar el número de policías en un esfuerzo 
para reducir los delitos. Antes de tomar una decisión final, el ayuntamiento pide al jefe de policía 
realizar una encuesta en otras ciudades de tamaño similar para determinar la relación entre el 
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¿Puede ser cero la correlación 
entre la población? 


número de policías y el número de delitos reportados. El jefe de policía reunió la siguiente infor- 
mación muestral. ^ ^ 


Ciudad 

Policías 

Número de delitos 

Oxford 

15 

17 

Starksville 

17 

13 

Danvllle 

25 

5 

Athens 

27 

7 


Ciudad 

Policías 

Número de delitos 

Holgate 

17 

7 

Carey 

12 

21 

Whistler 

11 

19 

Woodville 

22 

6 


a) ¿Cuál variable es dependiente, y cuál independiente? Sugerencia: Si usted fuera el jefe de poli- 
cía, ¿qué variable decidiría? ¿Qué variable es aleatoria? 

b) Trace un diagrama de dispersión. 

c) Determine el coeficiente de correlación. 

d) Interprete el coeficiente de correlación. ¿Le sorprende que sea negativo? 

6. El propietario de Maumee Ford-Mercury-Volvo desea estudiar la relación entre la antigüedad de un 
automóvil y su precio de venta. La siguiente lista es una muestra aleatoria de 12 automóviles usa- 
dos que vendió el concesionario durante el año anterior. 


Automóvil 

Antigüedad 

(años) 

Precio de venta 
(miles de dólares) 

Automóvil 

Antigüedad 

(años) 

Precio de venta 
(miles de dólares) 

1 

9 

8.1 

7 

8 

7.6 

2 

7 

6.0 

8 

11 

8.0 

3 

11 

3.6 

9 

10 

8.0 

4 

12 

4.0 

10 

12 

6.0 

5 

8 

5.0 

11 

6 

8.6 

6 

7 

10.0 

12 

6 

8.0 


a) Trace un diagrama de dispersión. 

b) Establezca el coeficiente de correlación. 

c) Interprete el coeficiente de correlación. ¿Le sorprende que sea negativo? 


13.4 Prueba de la importancia 
del coeficiente de correlación 

Recuerde que la gerente de ventas de Copier Sales of America determinó que la correlación 
entre el número de llamadas de ventas y el número de copiadoras vendidas era 0.759, lo que 
indicaba una asociación fuerte entre ambas variables. Sin embargo, en la muestra había sólo 
10 vendedores. ¿Puede ser que la correlación entre la población sea 0? Esto significaría que 
la correlación de 0.759 se debió a la casualidad. En este ejemplo, la población es todo el per- 
sonal de ventas de la empresa. 

Resolver este dilema requiere una prueba para responder la pregunta obvia: ¿puede haber 
una correlación cero entre la población de la cual se seleccionó la muestra? En otras palabras, 
¿proviene el valor r calculado de una población de observaciones pareadas con correlación 
cero? Para continuar la convención de usar letras griegas para representar un parámetro 
poblacional, p (se pronuncia “rho”) representará la correlación entre la población. 
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Continuaremos con el ejemplo de las llamadas de ventas y copiadoras vendidas, para 
emplear las mismas pruebas de hipótesis descritas en el capítulo 10. La hipótesis nula y la 
hipótesis alternativa son: 

H 0 : p = 0 (La correlación entre la población es cero.) 

Hp p # 0 (La correlación entre la población es diferente de cero.) 

Por la forma en que se formula se sabe que la prueba es de dos colas. 

La fórmula para t es: 


PRUEBA t DEL rVrW! 

t = , _ 2 con n - 2 grados de libertad (13-2) 

CORRELACIÓN T 


Con un nivel de significancia de 0.05, la regla de decisión en este caso indica que si el valor 
calculado de t se encuentra en el área entre +2.306 y —2.306, entonces no se rechaza la hipó- 
tesis nula. Para ubicar el valor crítico de 2.306, consulte el apéndice B.2 para gl = n - 2 = 10 
-2 = 8. Vea la gráfica 13-6. 


Región 


Región 

de rechazo 


de rechazo 

(hay correlación) 

/ H 0 no se^V 
rechaza (no hay 
correlación entre 
la población) 

(hay correlación) 

.025 

.025 

-2.306 

0 

2.306 Escala de t 


GRAFICA 13-6 Regla de decisión en la prueba de hipótesis con un nivel de significancia de 0.05 
y 8 gl 


Si aplica la fórmula (13-2) al ejemplo de la relación entre número de llamadas de ventas y 
unidades vendidas: 


rVrT ^ 2 .759 VIO - 2 

f “ VT^T 5 VI - ,759 r " ' 

El valor t calculado se encuentra en la reglón de rechazo. Por ello, H 0 se rechaza con un nivel 
de significancia de 0.05. Esto significa que la correlación entre la población no es cero. Desde 
un punto de vista práctico, esto Indica a la gerente de ventas que hay una correlación entre el 
número de llamadas de ventas y el número de copiadoras vendidas en la población de vende- 
dores. 

La prueba de hipótesis también se interpreta en términos de valores p. Un valor p es la 
probabilidad de determinar un valor del estadístico de prueba más extremo que el calculado, 
cuando H 0 es verdadera. Para determinar el valor p, consulte la distribución t en el apéndice 
B.2 y ubique la fila de 8 grados de libertad. El valor del estadístico de prueba es 3.297; por lo 
tanto, en la fila de 8 grados de libertad y una prueba de dos colas se encuentra el valor más 
cercano a 3.297. En una prueba de dos colas con un nivel de significancia de 0.02, el valor crí- 
tico es 2.896, y el valor crítico con un nivel de significancia de 0.01, 3.355. Como 3.297 se 
encuentra entre 2.896 y 3.355, se concluye que el valor p está entre 0.01 y 0.02. 

Tanto Minitab como Excel reportan la correlación entre dos variables. Además, Minitab 
reporta el valor p de la prueba de hipótesis en que la correlación entre la población entre dos 
variables sea 0. En la página siguiente se presenta una captura de pantalla de Minitab con los 
resultados. Éstos son los mismos que los que se calcularon antes. 
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Cjemplo 


Solución 


En el ejemplo de la página 470 se determinó que el coeficiente de relación entre la ganancia en 
la venta de un vehículo de Applewood Auto Group y la edad de la persona que compró dicho 
vehículo era de 0.262. Dado que el signo del coeficiente de correlación fue positivo, se conclu- 
yó que existía una relación directa entre ambas variables. Sin embargo, debido a que la cifra 
de correlación era baja —esto es, cercana a cero—, se concluyó que no había garantías en una 
campaña de publicidad dirigida a los compradores mayores, que generan una ganancia más 
grande. ¿Significa esto que se debe concluir que no existe relación entre las dos variables? 
Utilice un nivel de significancia de 0.05. 

Para comenzar a responder a la última pregunta, se deben aclarar los temas de la muestra y la 
población. Asumamos que los datos recolectados de los 180 vehículos vendidos por 
Applewood Group es una muestra de la población de todos los vehículos que la empresa ven- 
dió durante muchos años. La letra griega p es el coeficiente de relación entre la población, y r 
es el coeficiente de relación entre la muestra. 

El siguiente paso es establecer las hipótesis nula y alternativa. Hay que probar la hipóte- 
sis nula de que el coeficiente de correlación es igual a cero. La hipótesis alternativa es que exis- 
te una correlación positiva entre ambas variables. 

H 0 : p < 0 (La correlación entre la población es cero.) 

H-¡: p > 0 (La correlación entre la población es positiva.) 

Ésta es una prueba de una cola, porque el interés es confirmar una asociación positiva 
entre las variables. El estadístico de prueba sigue la distribución f, con n - 2 grados de liber- 
tad, así que los grados de libertad son 180 - 2 = 178. Sin embargo, la cifra de 178 grados de 
libertad no aparece en el apéndice B.2. El valor más cercano es 180, de modo que es el que 
se utilizará. La regla de decisión es rechazar la hipótesis nula si el valor calculado del estadís- 
tico de prueba es mayor a 1.653. 

Se utiliza la fórmula (13-2) para encontrar el valor del estadístico de prueba. 


t = 


rVn - 2 _ 0.262 Vi 80 - 2 
Vi - r 2 Vi - 0.262 2 


= 3.622 


Comparando el valor del estadístico de prueba de 3.622 con el valor crítico de 1.653, se 
rechaza la hipótesis nula. Se concluye que el coeficiente de correlación de la muestra de 0.262 
es demasiado grande como para provenir de una población sin correlación. Para decirlo en 
otras palabras, existe una correlación positiva entre la ganancia y la edad de la población. 
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El resultado es confuso y en apariencia contradictorio. Por una parte, se observa que el coe- 
ficiente de correlación no indica que haya una relación muy fuerte y que el departamento de mar- 
keting de Applewood Auto Group no debería usar esta formación para tomar decisiones 
promocionales y publicitarias. Por otra parte, la prueba de la hipótesis indicó que el coeficiente 
de correlación no es igual a cero y que existe una relación positiva entre la edad y la ganancia. 
¿Cómo puede ser esto? Es necesario ser muy cuidadosos con la interpretación de los resulta- 
dos de la prueba de la hipótesis. La conclusión es que el coeficiente de correlación no es igual 
a cero y que existe una relación positiva entre las ganancias y la edad del comprador. El resul- 
tado de la prueba de la hipótesis sólo muestra que existe una relación. La prueba de la hipóte- 
sis no revela nada con respecto a la fuerza de la relación. 



Una muestra de 25 campañas para la alcaldía de ciudades de tamaño medio con poblaciones entre 
50 000 y 250 000 habitantes demostró que la correlación entre el porcentaje de los votos recibidos 
y la cantidad gastada en la campaña por cada candidato fue 0.43. A un nivel de significancia de 
0.05, ¿hay una asociación positiva entre las variables? 


comed: 


Ejercicios 

7. Se dan las siguientes hipótesis. 

H 0 - P £0 

H,: p >0 

Una muestra aleatoria de 12 observaciones pareadas indicó una correlación de 0.32. ¿Se puede 
concluir que la correlación entre la población es mayor que cero? Utilice el nivel de significancia 
de 0.05. 

8. Se dan las siguientes hipótesis. 

H 0 : P > 0 

Hp p <0 

Una muestra aleatoria de 15 observaciones pareadas tiene una correlación de -0.46. ¿Se puede 
concluir que la correlación entre la población es menor que cero? Utilice el nivel de significancia 
de 0.05. 

9. La Pennsylvania Refining Company estudia la relación entre el precio de la gasolina y el número 
de galones que vende. En una muestra de 20 gasolineras el martes pasado, la correlación fue 0.78. 
A un nivel de significancia de 0.01 , la correlación entre la población, ¿será mayor que cero? 

10. Un estudio de 20 instituciones financieras de todo el mundo reveló que la correlación entre sus 
activos y las utilidades antes del pago de impuestos es 0.86. A un nivel de significancia de 0.05, 
¿se puede concluir que hay una correlación positiva entre la población? 

11. La asociación de pasajeros de aerolíneas estudió la relación entre el número de pasajeros en un 
vuelo en particular y su costo. Parece lógico que más pasajeros impliquen más peso y más equi- 
paje, lo que a su vez generará un costo de combustible mayor. Con una muestra de 15 vuelos, la 
correlación entre el número de pasajeros y el costo total del combustible fue 0.667. ¿Es razonable 
concluir que hay una asociación positiva entre las dos variables poblacionales? Utilice el nivel de 
significancia de 0.01 . 

12. La Student Government Association, de la Middle Carolina University, desea demostrar la relación 
entre el número de cervezas que beben los estudiantes y su contenido de alcohol en la sangre. 
Una muestra de 18 estudiantes participó en un estudio en el cual a cada uno se le asignó al azar 
un número de latas de cerveza de 12 onzas que debía beber. Treinta minutos después de consu- 
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mir su número asignado de cervezas un miembro de la oficina local del alguacil midió el conteni- 
do de alcohol en la sangre. La información muestral es la siguiente. 


Estudiante 

Cervezas 

Contenido de alcohol 
en la sangre 

1 

6 

0.10 

2 

7 

0.09 

3 

7 

0.09 

4 

4 

0.10 

5 

5 

0.10 

6 

3 

0.07 

7 

3 

0.10 

8 

6 

0.12 

9 

6 

0.09 


Estudiante 

Cervezas 

Contenido de alcohol 
en la sangre 

10 

3 

0.07 

11 

3 

0.05 

12 

7 

0.08 

13 

1 

0.04 

14 

4 

0.07 

15 

2 

0.06 

16 

7 

0.12 

17 

2 

0.05 

18 

1 

0.02 


Utilice un paquete de software estadístico para responder las siguientes preguntas. 

a) Elabore un diagrama de dispersión del número de cervezas consumidas y el contenido de 
alcohol en la sangre. Comente sobre la relación. ¿Parece fuerte o débil? ¿Parece directa o 
inversa? 

b) Determine el coeficiente de correlación. 

c) Con un nivel de significancia de 0.01, ¿es razonable concluir que hay una relación positiva 
entre el número de cervezas consumidas y el contenido de alcohol en la sangre de la pobla- 
ción? ¿Cuál es el valor p? 


13.5 Análisis de regresión 

OA3 Aplicar un análisis de En la sección anterior se desarrollaron medidas para expresar la fuerza y la dirección de la rela- 
regresión para estimar la ción lineal entre dos variables. En esta sección se elabora una ecuación para expresar la re- 
relación lineal entre dos lación lineal entre dos variables. Además, se desea estimar el valor de la variable dependiente 

variables. y con base en un valor seleccionado de la variable independiente X. La técnica para 

desarrollar la ecuación y proporcionar las estimaciones se denomina análisis de 
regresión. 

En la tabla 1 3-1 se reporta el número de llamadas de ventas y el número de uni- 
dades vendidas de una muestra de 10 representantes de ventas de Copier Sales of 
America. En la gráfica 13-1 se presenta esta información en un diagrama de disper- 
sión. Recuerde que probamos la significancia del coeficiente de correlación (r = 
0.759) y concluimos que existe una relación significativa entre ambas variables. 
Ahora se busca desarrollar una ecuación lineal que exprese la relación entre el 
número de llamadas de ventas, la variable independiente, y el número de unidades 
vendidas, la variable dependiente. A la ecuación de la recta para estimar Y con base 
en X se le denomina ecuación de regresión. 


ECUACIÓN DE REGRESIÓN Ecuación que expresa la relación lineal entre dos variables. 



Principio de los mínimos cuadrados 

En el análisis de regresión, el objetivo es utilizar los datos para trazar una línea que represen- 
te mejor la relación entre las dos variables. Nuestro primer enfoque es utilizar un diagrama de 
dispersión para visualizar la posición de la línea. 

El diagrama de dispersión de la gráfica 13-1 se reproduce en la gráfica 13-7, con una recta 
que une los puntos para ilustrar que una recta probablemente ajustaría los datos. Sin embar- 
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go, la recta trazada con una regla tiene una desventaja: en parte, su posición se basa en el cri- 
terio de la persona que traza la recta. Las rectas trazadas a mano en la gráfica 13-8 represen- 
tan los criterios de cuatro personas. Todas las rectas, excepto A, parecen razonables. Esto es, 
cada línea se centra entre los datos graficados. Sin embargo, cada una generaría una estima- 
ción distinta de unidades vendidas para un número particular de llamadas de ventas. 



GRÁFICA 13-7 Llamadas de ventas y copiadoras vendidas 
por 10 representantes de ventas 


GRÁFICA 13-8 Cuatro rectas superpuestas en 
el diagrama de dispersión 


Sin embargo, es preferible utilizar un método que resulte en una sola y mejor línea de regre- 
sión. Este método, que se denomina principio de los mínimos cuadrados, proporciona lo 
que comúnmente se conoce como recta del “mejor ajuste”. 


PRINCIPIO DE LOS MÍNIMOS CUADRADOS Determina una ecuación de regresión al minimizar la 
suma de los cuadrados de las distancias verticales entre los valores reales de Y y los valores 
pronosticados de Y. 


Para ilustrar este concepto, se trazan los mismos datos en las tres gráficas siguientes. Los 
puntos son los valores reales de Y, y los asteriscos son los valores predichos de Y para un 
valor dado de X. La recta de regresión de la gráfica 13-9 se determinó con el método de los 
mínimos cuadrados. Es la recta de mejor ajuste porque la suma de los cuadrados de las des- 
viaciones verticales respecto de sí misma es mínima. La primera gráfica (X = 3, Y = 8) se des- 
vía 2 unidades de la recta, calculada como 10 - 8. El cuadrado de la desviación es 4. La 
desviación al cuadrado de la gráfica en X = 4, Y = 18 es 16. La desviación al cuadrado de la 
gráfica en X = 5, Y = 1 6 es 4. La suma de las desviaciones al cuadrado es 24, calculada como 
4 + 16 + 4. 

Suponga que las rectas de las gráficas 13-10 y 13-1 1 se trazaron con una regla. La suma 
de las desviaciones verticales al cuadrado de la gráfica 13-10 es 44. En el caso de la gráfica 



GRÁFICA 13-9 Recta de mínimos 
cuadrados 


GRÁFICA 13-10 Recta trazada con 
una regla 


GRÁFICA 13-11 Recta diferente trazada 
con una regla 
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Cjemplo 


Solución 


13-11 es 132. Las dos sumas son mayores que la suma de la recta de la gráfica 13-9, deter- 
minada mediante el método de los mínimos cuadrados. 

La ecuación de una recta tiene la forma 


FORMA GENERAL DE LA ECUACION DE REGRESION LINEAL 


Y= a + bX 


(13-3) 


donde: 

Y, que se lee Y prima, es el valor de la estimación de la variable Y para un valor X selec- 
cionado. 

a es la intersección Y. Es el valor estimado de Y cuando X = 0. En otras palabras, a es 
el valor estimado de Y donde la recta de regresión cruza el eje Y cuando X es cero. 

b es la pendiente de la recta, o el cambio promedio en Y por cada cambio de una uni- 
dad (ya sea aumento o reducción) de la variable independiente X. 

X es cualquier valor de la variable Independiente que se seleccione. 

La forma general de la ecuación de la regresión lineal es exactamente la misma que la 
ecuación de cualquier línea, a es la intersección con y y ó es la pendiente. El propósito de un 
análisis de regresión es calcular los valores de a y ó para desarrollar una ecuación lineal que 
se ajuste mejor a los datos. 

Las fórmulas de ay b son: 


PENDIENTE DE LA RECTA DE REGRESIÓN b = r^- (13-4) 

S x 

\ Z J 


donde: 

r es el coeficiente de correlación. 
s y es la desviación estándar de Y (la variable dependiente). 
s x es la desviación estándar de X (la variable Independiente). 




INTERSECCIÓN CON EL EJE 


Y 


a = Y - bX 


(13 


-5) 


donde: 

Y es la media de / (la variable dependiente). 

X es la media de X (la variable independiente). 


Recuerde el ejemplo de Copier Sales of America. La gerente de ventas reunió información 
sobre los números de llamadas de ventas y de copiadoras vendidas de una muestra de 10 
representantes de ventas. Como parte de su presentación en la siguiente reunión de ventas, la 
señora Bancer desea presentar información específica acerca de la relación entre el número de 
llamadas y el número de ventas. Con el método de los mínimos cuadrados, determine una 
ecuación lineal que exprese la relación entre ambas variables. ¿Cuál es el número esperado de 
copiadoras vendidas de un representante de ventas que hizo 20 llamadas? 


El primer paso para determinar la ecuación de regresión es encontrar la pendiente de la recta de 
regresión de mínimos cuadrados. Es decir, se necesita el valor de b. En la página 468 se deter- 
minó el coeficiente de correlación r (0.759). En la captura de pantalla de Excel de la misma pági- 
na se determinó la desviación estándar de la variable independiente X (9.189) y la desviación 
estándar de la variable dependiente Y (14.337). Los valores están insertados en la fórmula (13-4). 


b = 



.759 


/14.337\ 
V 9.189 / 


1.1842 
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0A4 Interpretar un 
análisis de regresión. 



Estadística en acción 

En finanzas, los inversio- 
nistas tienen interés en el 
intercambio entre ganan- 
cias y riesgo. Una técnica 
para cuantificar el riesgo 
es el análisis de regresión 
del precio accionario de 
una compañía (variable 
dependiente) y una 
medida promedio del 
mercado accionario 
(variable independiente). 
Con frecuencia se 
emplea el índice 500 de 
Standard and Poor’s 
(S&P) para estimar el 
mercado. El coeficiente 
de regresión, denomina- 
do beta en finanzas, 
muestra el cambio del 
precio de las acciones de 
una compañía ante un 
cambio de una unidad 
en el índice de S&P. Por 
ejemplo, si una acción 
tiene una beta de 1.5, 
cuando el índice 
S&P aumenta 1%, su 
precio aumentará 1.5%. 

( continúa ) 


Después necesita encontrar el valor de a. Para hacerlo, utilice el valor de b que recién se calcu- 
ló, así como las medias del número de llamadas de ventas y del número de copiadoras vendi- 
das. Estas medias también se encuentran en la impresión de Excel de la página 468. De la 
fórmula (13-5): 

a = Y - bX = 45 - 1.1842(22) = 18.9476 

Así, la ecuación de regresión es Y = 18.9476 + 1.1842X. Por lo tanto, si un vende- 
dor hace 20 llamadas, debería vender 42.6316 copiadoras, número que se determina por 
Y = 18.9476 + 1.1842X = 18.9476 + 1.1842(20). El valor ó de 1 .1842 significa que por cada 
llamada de ventas adicional, el vendedor debería aumentar el número de copiadoras vendidas 
en aproximadamente 1 .2. En otras palabras, cinco llamadas de ventas adicionales en un mes 
generarán más o menos seis copiadoras más vendidas, número determinado por 1.1842(5) = 
5.921. 

El valor a de 18.9476 es el punto donde la ecuación cruza el eje Y. Una traducción literal 
es que si no se hacen llamadas de ventas, es decir, X = 0, se venderán 18.9476 copiadoras. 
Observe que X = 0 está fuera del rango de valores incluidos en la muestra y, por lo tanto, no 
se debe emplear para estimar el número de copiadoras vendidas. Las llamadas de ventas va- 
rían de 10 a 40, por lo que las estimaciones se deben hacer dentro de ese rango. 


Trazo de la recta de regresión 

La ecuación de mínimos cuadrados, Y = 18.9476 + 1.1842X, se traza en el diagrama de dis- 
persión. El primer representante de ventas de la muestra es Tom Keller, quien hizo 20 llama- 
das. Su número estimado de copiadoras vendidas es 7= 18.9476 + 1.1842(20) = 42.6316. 
La gráfica X = 20 y Y = 42.6316 se encuentra al moverse hasta 20 en el eje X y después en 
el sentido vertical hasta 42.6316. Los demás puntos en la ecuación de regresión se determi- 
nan al sustituir el valor particular de X en la ecuación de regresión. Se conectan todos los 
demás puntos para formar la recta. Vea la gráfica 13-12. 


Representante 
de ventas 

Llamadas 
de ventas 
(X) 

Ventas 

estimadas 

(Y) 

Representante 
de ventas 

Llamadas 
de ventas 
(X) 

Ventas 

estimadas 

&) 

Tom Keller 

20 

42.6316 

Carlos Ramírez 

10 

30.7896 

Jeff Hall 

40 

66.3156 

Rich Nlles 

20 

42.6316 

Brian Virost 

20 

42.6316 

Mike Kiel 

20 

42.6316 

Greg Fish 

30 

54.4736 

Mark Reynolds 

20 

42.6316 

Susan Welch 

10 

30.7896 

Soni Jones 

30 

54.4736 



GRÁFICA 13-12 Recta de regresión en el diagrama de dispersión 
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También sucede lo 
opuesto: si el índice S&P 
disminuye 1%, el precio 
de las acciones disminui- 
rá 1.5%. Si beta es 1.0, 
un cambio de 1% en el 
índice presentará un 
cambio de 1% en su pre- 
cio. Si beta es menor que 
1.0, un cambio de 1% en 
el índice presenta un 
cambio menor a 1% del 
precio accionario. 


La recta de regresión por mínimos cuadrados tiene algunas características interesantes y par- 
ticulares. Primero, siempre pasa por el punto (X, Y). Para demostrar esto, se predice el núme- 
ro de copiadoras vendidas con el número medio de llamadas de ventas. En este ejemplo, el 
número medio de llamadas de ventas es 22.0, determinado por X = 220/10. El número medio 
de copiadoras vendidas es 45.0, que se calcula mediante Y = 450/10 = 45. Si X = 22 y luego 
se emplea la ecuación de regresión para encontrar el valor estimado de Y, el resultado es: 

V= 18.9476 + 1.1842(22) = 45 

El número estimado de copiadoras vendidas es exactamente igual al número medio de copia- 
doras vendidas. En este ejemplo sencillo se muestra que la recta de regresión pasará por el 
punto que representa a las dos medias. En este caso, la ecuación de regresión pasará por 
el punto X = 22 y Y = 45. 

Segundo, como se analizó antes en esta sección, no hay otra recta que pase por los datos 
donde la suma de las desviaciones al cuadrado es menor. En otras palabras, el término 
2(y - Y) 2 es menor cuando se aplica la ecuación de regresión por mínimos cuadrados que 
en cualquier otro caso. Para demostrar esta condición se emplea Excel. 



En las columnas A, B, y C en la hoja de cálculo de Excel anterior se duplicó la información 
muestral de la tabla 13-1. En la columna D se proporcionan los valores de las ventas estima- 
das, los valores Y, como se calculó antes. 

En la columna E se calcularon los residuales, o los valores de error. Ésta es la diferencia 
entre los valores reales y los valores pronosticados. Es decir, la columna E es (Y - Y). En el 
caso de Soni Jones, 

Y = 18.9476 + 1.1842(30) = 54.4736 
Su valor real es 70. Por lo tanto, el residual, o error de estimación, es 
(Y - Y) = (70 - 54.4736) = 15.5264 

Este valor refleja que la cantidad del valor predicho de ventas está “fuera” del valor de ventas 
real. 

Luego, en la columna F se elevan al cuadrado los residuales de cada vendedor y se obtie- 
ne el resultado. El total es 784.2105. 

2(Y- Y) 2 = 159.5573 + 39.8868 + ■ ■ ■ + 241.0691 = 784.2105 

Ésta es la suma de las diferencias al cuadrado o el valor de los mínimos cuadrados. No hay 
otra recta que pase por estos 10 puntos de datos donde la suma de las diferencias al cuadra- 
do sea menor. 

Es posible demostrar el criterio de los mínimos cuadrados con dos ecuaciones arbitrarias 
cercanas a la ecuación de mínimos cuadrados y calcular la suma de las diferencias al cuadra- 
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do de estas ecuaciones. En la columna G se utilizó la ecuación Y* = 19 + 1.2X para determi- 
nar el valor pronosticado. Observe que esta ecuación es muy similar a la de mínimos cuadra- 
dos. En la columna H se determinan los residuos y se elevan al cuadrado. En el caso del primer 
vendedor, Tom Keller. 

Y* = 19 + 1.2(20) = 43 
C Y - Y*) 2 = (43 - 30) 2 = 1 69 

Se realiza este procedimiento con los otros nueve representantes de ventas y se obtiene el 
total de los residuales al cuadrado. El resultado es 786, un valor mayor (786 contra 784.2105) 
que los residuales de la recta por mínimos cuadrados. 

En las columnas I y J de la captura de pantalla se repite el proceso anterior para otra ecua- 
ción Y** = 20 + X. De nuevo, esta ecuación es similar a la de mínimos cuadrados. Los deta- 
lles de Tom Keller son: 

Y** = 20 + X = 20 + 20 = 40 
(Y - Y**) 2 = (30 - 4 O) 2 = 1 00 

Se repite este procedimiento con los otros nueve representantes de ventas y se obtiene el total 
de los residuales. El resultado es 900, también mayor que los valores de los mínimos cuadra- 
dos. 

¿Qué demuestra este ejemplo? La suma de los residuales al cuadrado [S(V - Y) 2 ] de la 
ecuación de los mínimos cuadrados es menor que la de otras rectas seleccionadas. En resu- 
men, no se encuentra una recta que pase por estos puntos de datos donde la suma de los 
residuales al cuadrado sea menor. 



Consulte la autoevaluación 13-1, donde el propietario de Haverty’s Furniture Company estudió la 
relación entre las ventas y la cantidad que gastaba en publicidad. La información de las ventas de 
los cuatro últimos meses se repite a continuación. 


Mes 

Gastos en publicidad 
(millones de dólares) 

Ganancias por ventas 
(millones de dólares) 

Julio 

2 

7 

Agosto 

1 

3 

Septiembre 

3 

8 

Octubre 

4 

10 


a) Determine la ecuación de regresión. 

b ) Interprete los valores de a y b. 

c) Estime las ventas cuando se gastan $3 millones en publicidad. 


connect 


Ejercicios 

13. Las siguientes observaciones muéstrales se seleccionaron al azar. m 


X: 4 5 3 6 10 

Y. 4 6 5 7 7 


a) Determine la ecuación de regresión. 

b) Encuentre el valor de Y cuando X es 7. 

14. Las siguientes observaciones muéstrales se seleccionaron al azar. m 


X 5 

3 

6 

3 

4 

4 

6 

8 

/: 13 

15 

7 

12 

13 

11 

9 

5 
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a) Determine la ecuación de regresión. 

b) Encuentre el valor de Y cuando X es 7. 

15 . La Bradford Electric llluminating Company estudia la relación entre kilowatts-hora (miles) consumi- 
dos y el número de habitaciones de una residencia privada familiar. Una muestra aleatoria de 10 
casas reveló lo siguiente. m 


Número de 
habitaciones 

Kilowatts-hora 

(miles) 

Número de 
habitaciones 

Kilowatts-hora 

(miles) 

12 

9 

8 

6 

9 

7 

10 

8 

14 

10 

10 

10 

6 

5 

5 

4 

10 

8 

7 

7 


a) Determine la ecuación de regresión. 

b) Encuentre el número de kilowatts-hora, en miles, de una casa de seis habitaciones. 

16 . El señor James McWhinney, presidente de Daniel-James Financial Services, considera que hay 
una relación entre el número de contactos con sus clientes y la cantidad de ventas. Para probar 
esta afirmación, el señor McWhinney reunió la siguiente información muestral. La columna X indi- 
ca el número de contactos con sus clientes el mes anterior, mientras que la columna Y indica el 
valor de las ventas (miles de $) el mismo mes por cada cliente muestreado. Sjg 


Número de 
contactos , 

X 

Ventas (miles 
de dólares), 

Y 

Número de 
contactos, 

X 

Ventas (miles 
de dólares), 

Y 

14 

24 

23 

30 

12 

14 

48 

90 

20 

28 

50 

85 

16 

30 

55 

120 

46 

80 

50 

110 


a) Determine la ecuación de regresión. 

b) Encuentre las ventas estimadas si se hicieron 40 contactos. 

17 . En un artículo reciente en BusinessWeek se enumeran las “Best Small Companies”. Nos interesan 
los resultados actuales de las ventas e ingresos de ellas. Se seleccionó una muestra de 12 empre- 
sas, y a continuación se reportan sus ventas e ingresos, en millones de dólares. 


Compañía 

Ventas 
(miles de 
dólares) 

Ingresos 
(miles de 
dólares) 

Compañía 

Ventas 
(miles de 
dólares) 

Ingresos 
(miles de 
dólares) 

Papa John’s International 

$89.2 

$4.9 

Checkmate Electronics 

$17.5 

$ 2.6 

Applied Innovatíon 

18.6 

4.4 

Royal Grlp 

11.9 

1.7 

Integracare 

18.2 

1.3 

M-Wave 

19.6 

3.5 

Wall Data 

71.7 

8.0 

Servlng-N-Slide 

51.2 

8.2 

Davidson & Associates 

58.6 

6.6 

Daig 

28.6 

6.0 

Chico’s FAS 

46.8 

4.1 

Cobra Golf 

69.2 

12.8 


Sean las ventas la variable independiente, y los ingresos, la dependiente. 

a) Trace un diagrama de dispersión. 

b) Calcule el coeficiente de correlación. 

c) Determine la ecuación de regresión. 

d) Estime los ingresos de una compañía pequeña con ventas por $50.0 millones. 

18 . Se realiza un estudio de fondos mutualistas para fines de inversión en varios de ellos. Este estu- 
dio en particular se enfoca en los activos y su desempeño a cinco años. La pregunta: ¿es posible 
determinar la tasa de rendimiento a cinco años con base en los activos del fondo? Se selecciona- 
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OA5 Evaluar la significancia 
de la pendiente de la 
ecuación de regresión. 


ron nueve fondos mutualistas ai azar, y sus activos y tasas de recuperación se muestran a conti- 
nuación. ^ ^ 


Fondo 

Activos 
(en millones 
de dólares) 

Rendimiento 

(%) 

AARP High Quality Bond 

$622.2 

10.8 

Babson Bond L 

160.4 

11.3 

Compass Capital Fixed Income 

275.7 

11.4 

Galaxy Bond Retail 

433.2 

9.1 

Keystone Custodian B-1 

437.9 

9.2 


Fondo 

Activos 
(en millones 
de dólares) 

Rendimiento 

(%) 

MFS Bond A 

$494.5 

11.6 

Nichols Income 

158.3 

9.5 

T. Rowe Price Short-term 

681.0 

8.2 

Thompson Income B 

241.3 

6.8 


a) Trace un diagrama de dispersión. 

b) Calcule el coeficiente de correlación. 

c) Escriba un reporte breve de sus resultados en los incisos b) y c). 

d) Determine la ecuación de regresión. Utilice los activos como variable independiente. 

e) Para un fondo con $400.0 millones en ventas, determine la tasa de rendimiento a cinco años 
(en porcentaje). 

19. Consulte el ejercicio 5. 

a) Determine la ecuación de regresión. 

b) Estime el número de delitos en una ciudad con 20 policías. 

c) Interprete la ecuación de regresión. 

20. Consulte el ejercicio 6. 

a) Determine la ecuación de regresión. 

b) Estime el precio de venta de un automóvil de 10 años. 

c) Interprete la ecuación de regresión. 


13.6 Probar la significancia de la pendiente 

En la sección anterior se mostró cómo encontrar la ecuación de la línea de regresión que mejor 
se ajusta a los datos. El método para encontrar la ecuación se basa en el principio de los míni- 
mos cuadrados. El propósito de la ecuación de regresión es cuantificar una relación lineal entre 
dos variables. 

El siguiente paso es analizar la ecuación de regresión mediante una prueba de hipótesis 
para ver si la pendiente de la recta de regresión es distinta a cero. ¿Por qué es importante 
esto? Si es posible demostrar que la pendiente de la recta de la población es distinta de cero, 
entonces se puede concluir que al utilizar la ecuación de regresión aumenta la capacidad de 
predecir o pronosticar la variable dependiente basándose en la variable independiente. Si no 
se puede demostrar que esta pendiente es distinta de cero, entonces se concluye que no tiene 
caso utilizar la variable independiente como elemento de predicción. En otras palabras, si no 
podemos demostrar que la pendiente de la recta es distinta de cero, podríamos utilizar la 
media de la variable dependiente como factor de predicción, en vez de usar la ecuación de 
regresión. 

De acuerdo con el procedimiento de prueba de hipótesis que se expuso en el capítulo 10, 
las hipótesis nula y alternativa son: 

H 0 : |3 = 0 

H,: |3 # o 

La letra griega beta (p) se utiliza para representar la pendiente de la población de la ecuación 
de regresión. Esto es consistente con nuestra política de identificar los parámetros de pobla- 
ción mediante las letras griegas. Se supone que la información respecto de Copier Sales of 
America, la tabla 13-2 y el ejemplo del Applewood Auto Group son muestras. Cuidado aquí. 
Recuerde, ésta es sólo una muestra, pero cuando seleccionamos a un vendedor en particular 
Identificamos dos piezas de información: a cuántos clientes llamó y cuántas copiadores se 
vendieron. Sin embargo, sigue siendo sólo una muestra. 
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Identificamos el valor de la pendiente como b. Así que la pendiente “b" calculada se basa 
en una muestra y es una estimación de la pendiente de la población, identificada como “p”. 
La hipótesis nula es que la pendiente de la ecuación de regresión de la población es cero. Si 
éste es el caso, la recta de regresión es horizontal y no existe relación entra la variable inde- 
pendiente, X, y la variable dependiente, Y. En otras palabras, el valor de la variable dependien- 
te es el mismo para cualquier valor de la variable independiente, y no nos ayuda para calcular 
el valor de la variable dependiente. 

¿Qué ocurre si se rechaza la hipótesis nula? Si ella se rechaza y se acepta la hipótesis 
alternativa, se deduce que la pendiente de la recta de regresión de la población no es igual a 
cero. Esto es, conocer el valor de la variable independiente permite realizar una mejor estima- 
ción de la variable dependiente. Para decirlo de otra forma, existe una relación significativa 
entre ambas variables. 

Antes de probar la hipótesis, utilizamos un software estadístico para determinar los esta- 
dísticos de regresión necesarios. Seguimos utilizando los datos de Copler Sales of America de 
la tabla 1 3-2 y Excel para realizar los cálculos. La hoja de cálculo siguiente muestra tres tablas 
a la derecha de los datos de la muestra. 


fej t ritfártt r »9 vt Igr 

m 


A 

• 

c 

1 | 

c«fti 


3 lemK—r 

30 

10 

1 

40 

«0 

4 vrtxft 

30 

40 

S Cr« 4 *«ri 

» 

•0 

0 Wu*w«fc»i 

10 

10 

7 

10 

40 

s »»<*N**t 

30 

40 

t MlMKlti 

30 

10 

10 MKtRryneKh 

30 

10 

U *onJ>on«t 

•O 

70 


o . i . 
fUMMUttOUTPUT 



AXOVA 


MI 


Mfrtwon 

ToUé 


I IMS 7V9 

i 7t4.ni 

t 


IMS 7» 10173 


0011 


StOAéort ürot fSW 4 * 


SSL 


IIMM 


l«W 


333 ** o 


1 . Comenzando en la parte de arriba, están las Regression Statistics (Estadísticos de regre- 
sión). Usaremos esta información más adelante en este capítulo, pero note que el valor 
“Múltiple R” es familiar. Es 0.759, que es el coeficiente de correlación calculado en la sec- 
ción 13-2 utilizando la fórmula (13-1). 

2. En seguida está la tabla ANOVA. Es una herramienta útil para resumir la información de 
regresión. Nos referiremos a ella más adelante en este capítulo, y la usaremos ampliamen- 
te en el siguiente cuando estudiemos la regresión múltiple. 

3. Abajo, resaltada en azul, se encuentra la información necesaria para efectuar nuestra 
prueba de hipótesis con respecto a la pendiente de la recta. Incluye el valor de la pendien- 
te, que es 1.18421, y la intersección, que es 18.9474. (Note que estos valores de la pen- 
diente y la intersección son ligeramente distintos a los calculados en las páginas 478 y 
479. Estas pequeñas diferencias se deben al redondeo.) En la columna a la derecha del 
coeficiente de regresión está una columna etiquetada “Standard Error” (“Error estándar”). 
Este valor es similar al error estándar de la media. Recuerde que el error estándar de la 
media reporta la variación entre las medias muéstrales. En forma similar, estos errores 
estándares reportan la posible variación de los valores de la pendiente y de la intersec- 
ción. El error estándar del coeficiente de la pendiente es 0.35914. 

Para probar la hipótesis nula, utilizamos la distribución t con (n - 2 grados de libertad) y la 
siguiente fórmula: 
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PRUEBA DE LA PENDIENTE t = - - con n - 2 grados de libertad (13-6) 

^ Sfa ) 


donde: 

b es la estimación de la pendiente de la recta de regresión, calculada a partir de la infor- 
mación de la muestra. 

s b es el error estándar de la estimación de la pendiente, determinado también a partir de 
la información de la muestra. 

Nuestro primer paso es establecer las hipótesis nula y alternativa, que son: 


H 0 : p < 0 
H{. p > 0 


Observe que tenemos una prueba de una cola. Si no rechazamos la hipótesis nula, se conclu- 
ye que la pendiente de la recta de regresión entre la población podría ser cero. Esto significa 
que la variable independiente no tiene valor para mejorar nuestra estimación de la variable 
dependiente. En este caso, esto quiere decir que conocer el número de llamadas de ventas 
que realizó un representante no nos ayuda a predecir las ventas. 

Si rechazamos la hipótesis nula y aceptamos la alternativa, se concluye que la pendiente 
de la recta es mayor a cero. Por lo tanto, la variable Independiente es una ayuda para prede- 
cir la variable dependiente. Por ello, conocer el número de llamadas de ventas que realizó un 
representante nos ayudará a pronosticar las ventas que efectuó. También sabemos, porque 
hemos demostrado que la pendiente de la recta es mayor a cero —esto es, positiva—, que más 
llamadas de ventas se traducirán en la venta de más copiadoras. 

La distribución t es el estadístico de prueba; hay 8 grados de libertad, determinados por 
n - 2 = 10 - 2. Utilizamos el nivel de significancia 0.05. Del apéndice B.2 obtenemos que el 
valor crítico es 1 .860. Nuestra regla de decisión es rechazar la hipótesis nula si el valor calcu- 
lado con la fórmula (13-6) es mayor a 1 .860. Aplicamos la fórmula (13-6) para encontrar t. 


b - 0 

s b 


1.18421 - 0 
0.35814 


3.297 


El valor calculado de 3.297 excede el valor crítico de 1 .860, así que rechazamos la hipótesis 
nula y aceptamos la hipótesis alternativa. Concluimos que la pendiente de la recta es mayor a 
cero. La variable independiente, que se refiere al número de llamadas de venta, es útil para 
obtener una mejor estimación de las ventas. 

La tabla proporciona también información sobre el valor p de esta prueba. Esta celda está 
resaltada en color púrpura. Por ello, podemos seleccionar un nivel de significancia, digamos 
0.05, y comparar ese valor con el valor p. En este caso, el valor p calculado en la tabla es 
.01090, de modo que la decisión es rechazar la hipótesis nula. Una precaución importante 
es que los valores p que se reportan en el software estadístico suelen ser para una prueba de 
dos colas. 

Antes de continuar, una nota interesante. Observe que en la página 473, cuando realiza- 
mos una prueba de hipótesis con respecto al coeficiente de correlación con estos mismos 
datos utilizando la fórmula (13-2), obtuvimos el mismo valor del estadístico f, f = 3.297. En rea- 
lidad, las pruebas de dos colas son equivalentes y siempre arrojarán exactamente los mismos 
valores de t y los mismos valores p. 



Consulte la autoevaluación 13-1, donde el propietario de Haverty’s Furniture estudió la relación 
entre las ventas y la cantidad que gastó en publicidad durante un mes. La cantidad de ventas es la 
variable dependiente, y el gasto en publicidad es la variable independiente. La ecuación de regre- 
sión en ese estudio fue Y = 1.5 + 2.2X. para una muestra de cinco meses. Realice una prueba de 
hipótesis para demostrar que existe una relación positiva entre la publicidad y las ventas. En el soft- 
ware estadístico, el error estándar del coeficiente de regresión es 0.42. Utilice el nivel de significan- 
cia 0.05. 
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comed: 


OA6 Evaluar una ecuación 
de regresión para predecir la 
variable dependiente. 


Ejercicios 

21 . Remítase al ejercicio 5. La ecuación de regresión es Y = 29.29 - 0.96X, el tamaño de la 
muestra es 8, y el error estándar de la pendiente es 0.22. Aplique el nivel de significancia 
0.05. ¿Podemos concluir que la pendiente de la recta de regresión es menor a cero? 

22 . Refiérase al ejercicio 6. La ecuación de regresión es Y = 11.18 - 0.49X, el tamaño de la 
muestra es 12, y el error estándar de la pendiente es 0.23. Aplique el nivel de significancia 
0.05. ¿Podemos concluir que la pendiente de la recta de regresión es menor a cero? 

23 . Remítase al ejercicio 17. La ecuación de regresión es Y = 1.85 + .08X, el tamaño de la mues- 
tra es 12, y el error estándar de la pendiente es 0.03. Aplique el nivel de significancia 0.05. 
¿Podemos concluir que la pendiente de la recta de regresión es distinta a cero ? 

24 . Refiérase al ejercicio 18. La ecuación de regresión es Y = 9.9198 - 0.00039X, el tamaño de la 
muestra es 9, y el error estándar de la pendiente es 0.0032. Aplique el nivel de significancia 
0.05. ¿Podemos concluir que la pendiente de la recta de regresión es menor a cero? 


13.7 Evaluación de la capacidad 

predictora de una ecuación de regresión 

Error estándar de estimación 

Los resultados del análisis de regresión de Copier Sales of America muestran una relación sig- 
nificativa entre el número de llamadas de ventas y el número de ventas que se concretó. Al 
sustituir el nombre de las variables en la ecuación, ésta puede ser escrita como: 

Número de copiadoras vendidas = 18.9476 + 1.1842 (Número de llamadas de ventas) 

La ecuación puede ser usada para estimar el número de copiadoras vendidas por cada 
“número de llamadas de ventas” dentro del rango de los datos. Por ejemplo, si el número de 
llamadas de ventas es 30, se puede predecir el número de copiadoras vendidas. Es 54.4736, 
determinado por 18.9476 + 1.1842(30). Sin embargo, los datos muestran dos representantes 
con ventas de 60 y 70 copiadoras. ¿La ecuación de regresión es un buen predictor del 
“Número de copiadoras vendidas”? 

En realidad, el pronóstico perfecto, que implica encontrar el resultado exacto, es imposi- 
ble en economía y negocios. Por ejemplo, los ingresos anuales de las ventas de gasolina (Y) 
con base en el número de registros de automóviles (X) desde una cierta fecha, sin duda que 
se podrían calcular con cierta precisión, pero el pronóstico no sería exacto hasta el dólar 
más cercano, o tal vez ni siquiera hasta los miles de dólares más cercanos. Incluso, en oca- 
siones, los pronósticos de resistencia a la tensión de varillas de acero con base en los diáme- 
tros exteriores de las varillas son inexactos debido a ligeras diferencias en la composición del 
acero. 

Por ello, es necesario contar con una medida para describir cuán preciso es el pronósti- 
co de Y con base en X, o a la inversa, qué tan inexacta puede ser la estimación. Esta medida 
se denomina error estándar de estimación. El error estándar del estimado está simbolizado 
por s y . x . El subíndice y -x se interpreta como el error estándar de y para un valor dado de x. 
Es el mismo concepto que el de la desviación estándar que se analizó en el capítulo 3. La des- 
viación estándar mide la dispersión respecto de la media. El error estándar de estimación mide 
la dispersión respecto de la recta de regresión. 


ERROR ESTÁNDAR DE ESTIMACIÓN Medida de la dispersión de los valores observados respecto 
de la recta de regresión para un valor dado de X. 
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OA7 Calcular e interpretar 
el coeficiente de 
determinación. 


El error estándar de estimación se determina con la fórmula (13-7). 


ERROR ESTÁNDAR DE ESTIMACIÓN 


y ■ x 



Yf 

2 


(13-7) 


El cálculo del error estándar de estimación requiere de la suma de las diferencias al cua- 
drado entre cada valor observado de / y el valor predicho de Y, que se Identifica como Y en 
el numerador. Este cálculo se ¡lustra en la hoja de cálculo de la página 484. Observe la celda 
G13 de la hoja de cálculo. Es un valor muy importante. Es el numerador en el cálculo del error 
estándar de estimación. 



n 

2 


784.211 

10-2 


9.901 


Este cálculo puede ser eliminado utilizando un software estadístico como Excel. El error están- 
dar de estimación se incluye en el análisis de regresión de Excel y está resaltado en amarillo 
en la página 484. Su valor es 9.901. 

Si el error estándar de estimación es pequeño, significa que los datos están relativamen- 
te cercanos a la recta de regresión, y la ecuación de regresión sirve para predecir Y con poco 
error. Si el error estándar de estimación es grande, significa que los datos están muy disper- 
sos respecto de la recta de regresión, y la ecuación de regresión no proporcionará una esti- 
mación precisa de Y. 


El coeficiente de determinación 

El error estándar de estimación proporciona una medida relativa de la capacidad de predic- 
ción de una ecuación de regresión. En la próxima sección lo utilizaremos para proporcionar 
información más específica con respecto a una predicción. En esta sección se explica otro 
estadístico que brindará una medida más interpretable de la capacidad de predicción de una 
ecuación de regresión. Se llama coeficiente de determinación, o R cuadrada. 


COEFICIENTE DE DETERMINACIÓN Proporción de la variación total de la variable dependiente Y 
que se explica, o contabiliza, por la variación de la variable dependiente X. 


El coeficiente de determinación es fácil de calcular. Es el coeficiente de correlación al cua- 
drado. Por lo tanto, también se usa el término R al cuadrado. En el caso de Copier Sales of 
America, el coeficiente de correlación de la relación entre el número de copiadoras vendidas 
y el número de llamadas de ventas es 0.759. Si calculamos (0.759) 2 , el coeficiente de determi- 
nación es 0.576. Observe las celdas azul (Múltiple R) y verde (fl-square) resaltadas en la hoja 
de cálculo de la página 484. Para interpretar mejor el coeficiente de determinación, conviérta- 
lo a porcentajes. Así, se dice que 57.6% de la variación del número de copiadoras vendidas 
se explica, o está representado por la variación del número de llamadas de ventas. 

¿Con cuánta exactitud predice la ecuación de regresión el número de copiadoras vendi- 
das mediante el número de llamadas de ventas realizadas? Si fuera posible hacer prediccio- 
nes perfectas, el coeficiente de determinación sería de 100%. Esto significaría que la variable 
independiente, el número de llamadas de ventas, explica, o representa, toda la variación del 
número de copiadoras vendidas. Un coeficiente de determinación de 100% se asocia con un 
coeficiente de correlación de +1 .0 o —1.0. Consulte la gráfica 13-2, que muestra que una pre- 
dicción perfecta se asocia con una perfecta relación lineal, donde todos los puntos de los 
datos forman una recta perfecta en un diagrama de dispersión. Nuestro análisis muestra que 
sólo 57.6% de la variación del número de copiadoras vendidas se explica por la variación del 
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número de llamadas de ventas que se realizó. Es claro que estos datos no forman una línea 
perfecta. En vez de eso, los datos se diseminan alrededor de la recta de regresión de mínimos 
cuadrados que mejor se ajusta, y habrá un error en las predicciones. En la próxima sección se 
utiliza el error estándar de estimación para proporcionar información más específica con res- 
pecto al error asociado con el empleo de la ecuación de regresión para hacer predicciones. 


Autoevaluación 13-5 Consulte la autoevaluación 13-1, donde el propietario de la Haverty’s Furniture Company estudió la 
relación entre la cantidad que gastó en publicidad y los ingresos por ventas en un mes dado. La 
cantidad de ventas es la variable dependiente, y el gasto en publicidad es la variable independiente. 

a) Determine el error estándar de estimación. 

b) Determine el coeficiente de determinación. 

c) Interprete el coeficiente de determinación. 



comect 


Ejercicios 

(Quizás desee utilizar un paquete de software como Excel para realizar los cálculos.) 

25 . Refiérase al ejercicio 5. Determine el error estándar de estimación y el coeficiente de determina- 
ción. Interprete el coeficiente de determinación. 

26 . Remítase al ejercicio 6. Determine el error estándar de estimación y el coeficiente de determina- 
ción. Interprete el coeficiente de determinación. 

27 . Refiérase al ejercicio 15. Determine el error estándar de estimación y el coeficiente de determina- 
ción. Interprete el coeficiente de determinación. 

28 . Regrese al ejercicio 16. Determine el error estándar de estimación y el coeficiente de determina- 
ción. Interprete el coeficiente de determinación. 


Relaciones entre el coeficiente de correlación, 
el coeficiente de determinación y el error 
estándar de estimación 

En la sección 13-7 se analizó el error estándar de estimación, el cual mide la cercanía entre los 
valores reales y la recta de regresión. Cuando el error estándar es pequeño, las dos variables 
están muy relacionadas. En el cálculo del error estándar, el término clave es 

2 (Y - Yf 

Si el valor de este término es pequeño, el error estándar también lo será. 

El coeficiente de correlación mide la fuerza de la asociación lineal entre dos variables. 
Cuando los puntos del diagrama de dispersión aparecen cerca de la recta, se observa que el 
coeficiente de correlación tiende a ser grande. Todo ello Indica que el error estándar de esti- 
mación y el coeficiente de correlación están inversamente relacionados. A medida que aumen- 
ta la fuerza de la relación lineal entre dos variables, aumenta el coeficiente de correlación y 
disminuye el error estándar de estimación. 

También se hizo notar que el cuadrado del coeficiente de correlación es el coeficiente 
de determinación, que mide el porcentaje de la variación de Y que se explica por la varia- 
ción de X. 

Un medio conveniente para mostrar la relación entre estas tres medidas es una tabla 
ANOVA. Observe la porción resaltada en amarillo en la hoja de cálculo de la página 489. Esta 
tabla es similar al análisis de la tabla de la vañanza que se desarrolló en el capítulo 12. En ese 
capítulo, la variación total se dividió en dos componentes: la debida a los tratamientos y la 
debida al error aleatorio. El concepto es similar en el análisis de regresión. La variación total 
se divide en dos componentes: 1) la que explica la regresión (a su vez explicada por la varia- 



13.7 Evaluación de la capacidad predictora de una ecuación de regresión 


489 


ble independiente) y (2) el error, o variación inexplicable. Estas categorías se identifican en la 
primera columna de la siguiente tabla ANOVA. La columna con el encabezado “gl" se refiere a 
los grados de libertad asociados a cada categoría. El número total de grados de libertad es 
n - 1. El número de grados de libertad de la regresión es 1, pues sólo hay una variable inde- 
pendiente. El número de grados de libertad asociados con el término de error es n - 2. El tér- 
mino “SS” ubicado en medio de la tabla ANOVA se refiere a la suma de los cuadrados. Note 
que el total de los grados de libertad es igual a la suma de los grados de libertad de la regre- 
sión y del residual (error), mientras que la suma total de los cuadrados es Igual a la suma de 
los cuadrados de la suma de la regresión y el residuo (error). Esto se aplica a cualquier tabla 
ANOVA. 
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La suma de cuadrados ANOVA se calcula como sigue: 

Suma de regresión de los cuadrados = SSR = 2(Y - Y) 2 = 1 065.789 

Suma del residual o error de los cuadrados = SSE = 2(Y - Y) 2 = 784.21 1 

Suma total de los cuadrados = SS total = 2(Y - Y) 2 = 1 850.00 

Recuerde que el coeficiente de determinación se define como el porcentaje de la varia- 
ción total (SS Total) explicado por la ecuación de regresión (SSR). El valor fí-cuadrado (r 2 ) 
puede ser validado mediante la tabla ANOVA. 


COEFICIENTE DE DETERMINACIÓN 


SSR 1 _ SSE 
SS total “ SS total 


(13-8) 


y 


Utilizando la tabla ANOVA, el coeficiente de determinación es 1065.789/1850.00 = 0.576. Por 
lo tanto, a mayor variación de la variable dependiente (SS Total) explicada por la variable inde- 
pendiente (SSR), más alto será el coeficiente de determinación. 

El coeficiente de determinación puede expresarse también en términos de la variación del 
residuo o error: 


r 2 = 1 


SSE 784.211 

SS total ~~ 1 850.00 


- 0.424 = 0.576 


En este caso, el coeficiente de determinación y la suma del residuo o error de los cuadrados 
están inversamente relacionados. Mientras más alta sea la variación inexplicable o error como 
porcentaje de la variación total, menor será el coeficiente de determinación. En este caso, 
42.4% de la variación total de la variable dependiente es una variación residual o error. 
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La observación final que relaciona el coeficiente de relación, el coeficiente de determina- 
ción y el error estándar de estimación es mostrar la relación entre el error estándar de esti- 
mación y la SSE. Al sustituir [SSE Suma de los cuadrados de residuo o error = SSE = 
2(/ - Y) 1 2 ] en la fórmula del error estándar de estimación, tenemos: 


ERROR ESTÁNDAR DE ESTIMACIÓN 





( 13 - 9 ) 


y 


comed 


En suma, el análisis de regresión proporciona dos estadísticos para evaluar la capaci- 
dad de predicción de una ecuación de regresión: el error estándar de estimación y el coe- 
ficiente de determinación. Al reportar los resultados de un análisis de regresión, es necesario 
explicar claramente los hallazgos, en especial cuando se emplean los resultados para ha- 
cer predicciones de la variable dependiente. El reporte siempre debe incluir un enunciado con 
respecto al coeficiente de determinación, para que el lector del reporte pueda conocer la rela- 
tiva precisión de la predicción. Se requiere un reporte objetivo del análisis estadístico para que 
los lectores puedan tomar sus propias decisiones. 

Ejercicios 

29 . Con la siguiente tabla ANOVA: 


Fuente 

GL 

SS 

MS 

F 

Regresión 

1 

1 000.0 

1 000.0 

26.00 

Error 

13 

500.0 

38.46 


Total 

14 

1 500.0 




a) Encuentre el coeficiente de determinación. 

b) Si hay una relación directa entre las variables, ¿cuál es el coeficiente de correlación? 

c) Determine el error estándar de estimación. 

30 . En el primer examen de estadística, el coeficiente de determinación entre las horas estudiadas y 
la calificación obtenida fue de 80%. El error estándar de estimación fue de 10. Había 20 estudian- 
tes en la clase. Elabore una tabla ANOVA para efectuar el análisis de regresión de horas estudia- 
das como un predictor de la calificación obtenida en el primer examen de estadísticas. 



Estadística en acción 

En ciertos estudios se 
reporta que, tanto en el 
caso de hombres como de 
mujeres, los considerados 
bien parecidos ganan 
salarios mayores que 
quienes no son considera- 
dos así. Además, en los 
hombres hay una correla- 

(continúa) 


13.8 Estimaciones de intervalo de predicción 

El error estándar y el coeficiente de determinación son dos estadísticos que proporcionan una 
evaluación general de la capacidad de una ecuación de regresión para predecir una variable 
dependiente. Otra forma de reportar tal capacidad es específica de un valor declarado de la 
variable independiente. Por ejemplo, podemos predecir el número de copiadoras vendidas (Y) 
en el caso de un valor seleccionado de número de llamadas de ventas realizadas (X). En rea- 
lidad, es posible calcular el intervalo de confianza del valor pronosticado de la variable depen- 
diente para un valor seleccionado de la variable independiente. 

Suposiciones de la regresión lineal 

Antes de presentar los intervalos de confianza, deben revisarse las suposiciones para aplicar 
de forma apropiada la regresión lineal. La gráfica 13-13 ilustra dichas suposiciones. 

1 . Para cada valor de X, existen valores Y correspondientes. Estos valores Y siguen la distri- 
bución normal. 

2. Las medias de estas distribuciones normales se encuentran en la recta de regresión. 
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ción entre estatura y 
salario. Por cada pulgada 
adicional de estatura, un 
hombre puede esperar 
ganar $250 dólares más 
al año. Por lo tanto, un 
individuo que mide 6’6” 
recibe un “bono” de 
$3 000 respecto de otro 
que mida 5’6”. Estar 
pasado de peso o muy 
delgado también se rela- 
ciona con los ingresos, en 
particular entre las muje- 
res. Un estudio de muje- 
res jóvenes demostró que 
10% de las que más pesa- 
ba ganaba más o menos 
6% menos que sus con- 
trapartes más delgadas. 



GRAFICA 13-13 Suposiciones de la regresión en forma gráfica 


3. Todas las desviaciones estándar de estas distribuciones normales son iguales. La mejor 
estimación de esta desviación estándar común es el error estándar de la estimación (s y . x ). 

4. Los valores Y son estadísticamente independientes. Esto significa que, al seleccionar una 
muestra, una X particular no depende de ningún otro valor de X. Esta suposición es de 
particular importancia cuando los datos se recopilan durante cierto periodo. En esas situa- 
ciones, los errores de un periodo particular con frecuencia están correlacionados con los 
de otros periodos. 

Recuerde del capítulo 7 que si los valores siguen una distribución normal, la media más o 
menos una desviación estándar comprenderá 68% de las observaciones, la media más 
o menos dos desviaciones estándar comprenderá 95% de las observaciones, y la media 
más o menos tres desviaciones estándar comprenderá virtualmente todas las observaciones. 
Existe la misma relación entre los valores anticipados Y y el error estándar de estimación ( s y . x ). 

1. Y ± s y . x incluirá 68% de las observaciones. 

2. Y ± 2 s y . x incluirá 95% de las observaciones. 

3. Y ± 3 s y . x incluirá virtualmente todas las observaciones. 

Ahora relacionamos estas suposiciones con la empresa Copier Sales of America, donde 
se estudió la relación entre el número de llamadas de ventas y el número de copiadoras que se 
vendieron. Suponga que se tomó una muestra mucho mayor que n = 10, pero que el error 
estándar de estimación aún fue de 9.901 unidades. Si se traza una recta paralela 9.901 unida- 
des por arriba de la recta de regresión y otra 9.901 por debajo de la recta de regresión, cerca 
de 68% de los puntos se encontraría entre ambas rectas. De manera similar, una recta 19.802 
[2s y . x = 2(9.901)] unidades arriba de la recta de regresión y otra 19.802 unidades debajo de 
la recta de regresión incluirán alrededor de 95% de los valores de datos. 

Como una verificación muy aproximada, consulte la columna E en la hoja de cálculo de 
Excel en la sección 13-5 de la página 480. Tres de las 10 desviaciones sobrepasan un error 
estándar de estimación. Es decir, la desviación de -12.6316 de Tom Keller, la de -12.6316 de 
Mark Reynolds y la de +15.5264 de Soni Jones sobrepasan el valor de 9.901, lo que es un 
error estándar de la recta de regresión. Todos los valores están dentro de 19.802 unidades de 
ella. En otras palabras, 7 de 10 desviaciones de la muestra están dentro de un error estándar 
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OA8 Calcular e interpretar 
los intervalos de confianza y 
de predicción. 


Cjemplo 


Solución 


de la recta de regresión y todas están dentro de dos, lo que es un buen resultado en el caso de 
una muestra relativamente pequeña. 

Intervalos de confianza e intervalos de predicción 

Cuando se utiliza una ecuación de regresión, se pueden hacer dos predicciones distintas para 
un valor seleccionado de la variable independiente. Las diferencias son sutiles pero muy 
importantes, y están relacionadas con las suposiciones que se explicaron en la sección ante- 
rior. Recuerde que para cada valor seleccionado de la variable independiente (X), la variable 
dependiente (Y) es una variable aleatoria que está distribuida normalmente con una media, Y. 
Cada distribución de Y tiene una desviación estándar igual al error estándar de estimación del 
análisis de regresión. 

El primer intervalo se denomina intervalo de confianza. Se utiliza cuando la ecuación de 
regresión se emplea para predecir el valor medio de Y para una X dada. Por ejemplo, se puede 
usar un intervalo de confianza para estimar el salario medio de todos los ejecutivos en la 
industria minorista con base en sus años de experiencia. Para determinar el intervalo de con- 
fianza del valor medio de Y para una X dada, la fórmula es: 


INTERVALO DE 
CONFIANZA DE LA 
MEDIA DE Y, DADA X 


Y±t(Sy. x ) A l- 


(X - X) 2 
2(X - X) 2 




(13-10) 

y 


El segundo tipo de estimación se denomina intervalo de predicción. Se utiliza cuando la 
ecuación de regresión se emplea para predecir una Y individual (n = 1) para un valor dado de 
X. Por ejemplo, para hacer una estimación del salario de ejecutivo minorista en particular con 
20 años de experiencia. Para determinar el intervalo de predicción de una estimación indivi- 
dual para una X dada, la fórmula es: 


INTERVALO DE y ± ts /i i 1 l (X ~ X í 

PREDICCIÓN DE Y, DADA X yx V n 2(X - X) 2 


(13-11) 

y 


De nuevo el ejemplo de la compañía Copier Sales of America. Determine un intervalo de con- 
fianza de 95% para todos los representantes de ventas que hacen 25 llamadas y un interva- 
lo de predicción para Sheila Baker, representante de ventas de la Costa Oeste que hizo 25 
llamadas. 

Emplee la fórmula (13-10) para determinar un intervalo de confianza. En la tabla 13-4 se inclu- 
yen los totales necesarios y se repite la información de la tabla 13-2 de la página 466. 

TABLA 13- Cálculos necesarios para determinar el intervalo de confianza y el intervalo 
de predicción 


Representante 
de ventas 

Llamadas 
de ventas, (X) 

Ventas de 
copiadoras, (Y) 

(X-X) 

(X-X) 2 

Tom Keller 

20 

30 

-2 

4 

Jeff Hall 

40 

60 

18 

324 

Brian Virost 

20 

40 

-2 

4 

Greg Fish 

30 

60 

8 

64 

Susan Welch 

10 

30 

-12 

144 

Carlos Ramírez 

10 

40 

-12 

144 

Rich Niles 

20 

40 

-2 

4 

Mike Kiel 

20 

50 

-2 

4 

Mark Reynolds 

20 

30 

-2 

4 

Soni Jones 

30 

70 

8 

64 




0 

760 
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El primer paso es determinar el número de copiadoras que se espera que venda un repre- 
sentante de ventas si él o ella hacen 25 llamadas. Éste es 48.5526, determinado por 
Y= 18.9476 + 1 . 1 842X = 18.9476 + 1.1842(25). 

Para encontrar el valor t, primero necesita conocer el número de grados de libertad. En 
este caso, los grados de libertad son n-2 = 10-2 = 8, con un nivel de confianza de 95%. 
Para encontrar el valor de f, desplácese hacia abajo a la izquierda de la columna del apéndice 
B.2 a 8 grados de libertad, y después muévase por la columna con el nivel de confianza de 
95%. El valor de f es 2.306. 

En la sección anterior se calculó que el error estándar de estimación era de 9.901. SeaX 
= 25, X = 2X/n = 220/10 = 22, y de la tabla 13-4, 2(X — X) 2 = 760. Sustituya estos valo- 
res en la fórmula (13-10) para determinar el intervalo de confianza. 



Intervalo de confianza 


= 48.5526 ± 7.6356 


Por lo tanto, el intervalo de confianza de 95% de todos los representantes de ventas que hacen 
25 llamadas es de 40.9170 a 56.1882. Para interpretar esto, redondee los valores. Si un repre- 
sentante de ventas hace 25 llamadas, debería vender 48.6 copiadoras. Es probable que estas 
ventas varíen de 40.9 a 56.2 copiadoras. 

Suponga que se desea estimar el número de copiadoras que vendió Sheila Baker, quien 
hizo 25 llamadas. El intervalo de predicción de 95% se determina como sigue: 



= 48.5526 ± 24.0746 


Así, el intervalo es de 24.478 a 72.627 copiadoras. Se concluye que el número de copiadoras 
que venderá un representante que haga 25 llamadas estará aproximadamente entre 24 y 73. 
Este intervalo es muy grande. Es mucho mayor que el intervalo de confianza de todos los repre- 
sentantes que hagan 25 llamadas. Sin embargo, es lógico que deba haber más variación en la 
estimación de ventas de un individuo que de un grupo. 


En la siguiente gráfica de Mlnltab se muestra la relación entre la recta de regresión (en el 
centro), el intervalo de confianza (en color rojo) y el intervalo de predicción (en color verde). Las 
bandas del intervalo de predicción siempre están más alejadas de la recta de regresión que 
las del intervalo de confianza. Asimismo, a medida que los valores de X se alejan del número 
medio de llamadas (22), ya sea en dirección positiva o negativa, las bandas del intervalo de 
confianza y del intervalo de predicción se ensanchan. Esto se debe al numerador del término 
de la derecha debajo del radical en las fórmulas (13-10) y (13-11). Es decir, cuando el térmi- 
no (X - X) 2 aumenta, también aumentan los anchos del Intervalo de confianza y del intervalo 
de predicción. En otras palabras, las estimaciones son menos precisas cuando hay un aleja- 
miento, en cualquier dirección, de la media de la variable independiente. 
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Es conveniente destacar de nuevo la distinción entre un intervalo de confianza y un inter- 
valo de predicción. Un intervalo de confianza se refiere a todos los casos con un valor dado 
de X y su valor se calcula por medio de la fórmula (1 3-1 0). Un intervalo de predicción se refie- 
re a un caso particular de un valor dado de X y su valor se determina mediante la fórmula 
(13-11). El intervalo de predicción siempre será más ancho debido al 1 adicional debajo del 
radical en la segunda ecuación. 


Autoevaluación 13-6 



Consulte los datos muéstrales en la autoevaluación 13-1, donde el propietario de Haverty’s 
Furniture estudió la relación entre las ventas y la cantidad que gastó en publicidad. La información 
de las ventas de los últimos cuatro meses se repite a continuación. 


Mes 

Gastos publicitarios (en 
millones de dólares) 

Ingresos por ventas 
(en millones de dólares) 

Julio 

2 

7 

Agosto 

1 

3 

Septiembre 

3 

8 

Octubre 

4 

10 


La ecuación de regresión calculada fue Y = 1.5 + 2.2X, y el error estándar, 0.9487. Las dos varia- 
bles se reportan en millones de dólares. Determine el intervalo de confianza de 90% para el mes 
común en el cual se gastaron $3 millones en publicidad. 


oonnect 


Ejercicios 

31. Consulte el ejercicio 13. 

a) Determine el intervalo de confianza 0.95 para la media pronosticada cuando X = 7. 

b) Establezca el intervalo de predicción 0.95 para un individuo proyectado cuando X = 7. 

32. Consulte el ejercicio 14. 

a) Determine el intervalo de confianza 0.95 para la media pronosticada cuando X = 7. 

b) Encuentre el intervalo de predicción 0.95 para una predicción individual cuando X = 7. 

33. Consulte el ejercicio 15. 

a) Determine el intervalo de confianza 0.95, en miles de kilowatts-hora, de la media de todas las 
casas con seis habitaciones. 

b) Encuentre el intervalo de predicción 0.95, en miles de kilowatts-hora, de una casa en particu- 
lar con seis habitaciones. 
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34. Consulte el ejercicio 16. 

a) Determine el intervalo de confianza 0.95, en miles de dólares, de la media de todo el personal 
de ventas que hace 40 contactos. 

b) Encuentre el intervalo de predicción 0.95, en miles de dólares, para un vendedor en particular 
que hace 40 contactos. 


1 3.9 Transformación de datos 

El coeficiente de correlación describe la fuerza de la relación lineal entre dos varia- 
bles. Puede ser que dos variables estén estrechamente relacionadas, pero que su 
relación no sea lineal. Debe tener cuidado cuando interprete el coeficiente de corre- 
lación. Un valor de r puede indicar que no hay una relación lineal, pero puede ser 
que haya una relación de alguna otra forma no lineal o curvilínea. 

Para explicar esta cuestión, a continuación se presenta una lista de 22 golfistas 
profesionales, el número de competencias en las que participaron, la cantidad de 
sus ganancias y su calificación media. En el golf, el objetivo es jugar 18 hoyos con 
el menor número de golpes. Por lo tanto, se esperaría que los golfistas con las cali- 
ficaciones medias más bajas tengan las ganancias mayores. En otras palabras, la 
calificación y las ganancias deben guardar una relación inversa. 

Phil Mickelson participó en 22 competencias, obtuvo ganancias por $5 784 823 
y tuvo una calificación media por ronda de 69.16. Fred Copules participó en 16 tor- 
neos, obtuvo ganancias por $1 396 109 y tuvo una calificación media por ronda de 
70.92. Los datos de los 22 golfistas son: 



Jugador 

Competencias 

Ganancias 

Calificación 

Vijay Singh 

29 

$10 905 166 

68.84 

Ernie Els 

16 

5 787 225 

68.98 

Phil Mickelson 

22 

5 784 823 

69.16 

Tiger Woods 

19 

5 365 472 

69.04 

Davis Love III 

24 

3 075 092 

70.13 

Chris DiMarco 

27 

2 971 842 

70.28 

John Daly 

22 

2 359 507 

70.82 

Charles Howell III 

30 

1 703 485 

70.77 

Kirk Triplett 

24 

1 566 426 

70.31 

Fred Couples 

16 

1 396 109 

70.92 

Tlm Petrovic 

32 

1 193 354 

70.91 

Brlny Baird 

30 

1 156 517 

70.79 

Hank Kuehne 

30 

816 889 

71.36 

J.L. Lewis 

32 

807 345 

71.21 

Aaron Baddeley 

27 

632 876 

71.61 

Cralg Perks 

27 

423 748 

71.75 

David Frost 

26 

402 589 

71.75 

Rich Beem 

28 

230 499 

71.76 

Dicky Pride 

23 

230 329 

72.91 

Len Mattiace 

25 

213 707 

72.03 

Esteban Toledo 

36 

115 185 

72.36 

David Gossett 

25 

21 250 

75.01 


La correlación entre las variables, ganancias y calificación, es —0.782. Ésta es una relación 
inversa muy negativa. Sin embargo, cuando se trazan los datos en un diagrama de dispersión, 
la relación no parece lineal; no parece seguir una recta. Observe el diagrama de dispersión a la 
derecha de la siguiente captura de pantalla de Minitab. Los puntos de datos de la calificación 
más baja y de la más alta parecen muy lejos de la recta de regresión. Además, en el caso de 
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las calificaciones entre 70 y 72, las ganancias están debajo de la recta de regresión. Si la rela- 
ción fuera lineal, se debería esperar que estos puntos estuvieran arriba y debajo de la recta. 
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¿Qué hacer para explorar otras relaciones (no lineales)? Una posibilidad es transformar una 
variable. Por ejemplo, en lugar de emplear Y como variable dependiente, se puede emplear su 
logaritmo, recíproco, cuadrado o raíz cuadrada. Otra posibilidad es transformar la variable 
independiente de la misma manera. Existen otras transformaciones, pero las anteriores son las 
más comunes. 

En el ejemplo de las ganancias en el golf, el cambio de la escala de la variable dependien- 
te es eficaz. Se determina el logaritmo de cada una de las ganancias de los golfistas, y luego, 
la correlación entre el logaritmo de las ganancias y la calificación. Es decir, se encuentra 
el logaritmo base 10 de las ganancias de $5 365 472 de Tiger Woods, que es 6.72961; 
luego, el logaritmo base 1 0 de cada una de las ganancias de los golfistas, y después se deter- 
mina la correlación entre el logaritmo de las ganancias y la calificación. El coeficiente de corre- 
lación aumenta de -0.782 a —0.969, lo que significa que el coeficiente de determinación es 
0.939 [r 2 = (— 0.969) 2 = 0.939]. Es decir, 93.9% de la variación del logaritmo de las ganancias 
se contabiliza por la calificación de la variable independiente. 

Se ha determinado una ecuación que ajusta los datos con más precisión que la recta. Es 
obvio que, a medida que aumenta la calificación media de un golfista, éste puede esperar que 
sus ganancias disminuyan. Ya no parece que algunos de los puntos de datos de la recta de 
regresión sean diferentes, como se determinó con las ganancias en lugar del logaritmo de las 
ganancias como variable dependiente. También observe que los puntos entre 70 y 72 ahora 
están distribuidos al azar arriba y debajo de la recta de regresión. 



También es posible estimar la cantidad de las ganancias con base en la calificación. A conti- 
nuación se presenta la captura de pantalla de la regresión en Minltab con la calificación como 
variable independiente y el logaritmo de las ganancias como la dependiente. 
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Para calcular las ganancias de un golfista con una calificación media de 70, se utiliza primero 
la ecuación de regresión para calcular el logaritmo de ganancias. 

Y = 37.198 - .43944X = 37.198 - .43944(70) = 6.4372 

El valor 6.4372 es el logaritmo base 10 de las ganancias. El antllogarltmo de 6.4372 es 
2 736 528. Por lo tanto, un golfista con una calificación media de 70 puede esperar ganar 
$2 736 528. También se puede evaluar el cambio en las calificaciones. El golfista anterior tenía 
una calificación media de 70, y ganancias estimadas de $2 736 528. ¿Cuánto menos esperaría 
ganar un golfista si su calificación media es 71 ? De nuevo, al despejar la ecuación de regresión: 

Y= 37.198 - .43944X = 37.198 - .43944(71) = 5.99776 

El antilogaritmo de este valor es $994 855. Entonces, con base en el análisis de regresión, 
existe un incentivo financiero cuantioso para que un golfista profesional disminuya su califica- 
ción media incluso en un golpe. Los jugadores de golf, o quienes conozcan a un golfista, com- 
prenden qué difícil sería ese cambio. Ese golpe vale más de $ 1 700 000. 


comed: 


Ejercicios 

35. Con las siguientes observaciones muéstrales, trace un diagrama de dispersión. Calcule el coefi- 
ciente de correlación. ¿La relación entre las variables parece lineal? Intente elevar al cuadrado la 
variable X y después determine el coeficiente de correlación. ^ ' 


X 

-8 

-16 

12 

2 

18 

Y 

58 

247 

153 

3 

341 


36. De acuerdo con la economía básica, conforme aumenta la demanda de un producto, el precio dis- 
minuye. A continuación se presenta el número de unidades de demanda y su precio. 


Demanda 

Precio 

2 

$120 . 0 

5 

90 . 0 

8 

80 . 0 

12 

70 . 0 

16 

50 . 0 

21 

45 . 0 

27 

31 . 0 

35 

30 . 0 

45 

25 . 0 

60 

21 . 0 


a) Determine la correlación entre precio y demanda. Trace los datos en un diagrama de disper- 
sión. ¿La relación parece lineal? 

b) Transforme el precio en un logaritmo base 10. Trace el logaritmo del precio y de la demanda. 
Determine el coeficiente de correlación. ¿Parece mejorar la relación entre las variables? 
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Resumen del capítulo 

I. Un diagrama de dispersión es una herramienta gráfica para representar la relación entre dos varia- 
bles. 

A. La variable dependiente se representa a escala en el eje Y, y es la variable que se debe estimar. 

B. La variable independiente se representa a escala en el ejeX, y es la variable que se emplea como 
estimador. 

II. El coeficiente de correlación mide la fuerza de la asociación lineal entre dos variables. 

A. Las dos variables deben estar al menos en la escala de medición del intervalo. 

B. El coeficiente de correlación varía desde -1.00 hasta 1.00. 

C. Si la correlación entre dos variables es 0, no hay asociación entre ellas. 

D. Un valor de 1 .00 indica una correlación positiva perfecta, y uno de -1 .00 indica una correlación 
negativa perfecta. 

E. Un signo positivo indica que hay una relación directa entre las variables, y un signo negativo, que 
hay una relación inversa. 

F. Se designa con la letra r, y se determina mediante la siguiente ecuación: 

r s(x-x)(/-y) (-I3--I) 

(n - 1)s x s y 

G. Con la siguiente ecuación se determina si la correlación en la población es distinta de 0. 


rVn - 2 

vT Tr 7 5 


con n - 2 grados de libertad 


(13-2) 


III. En el análisis de regresión, se estima una variable con base en otra variable. 

A. La variable que se estima es la variable dependiente. 

B. La variable con la cual se hace la estimación es la variable independiente. 

1. La relación entre las variables debe ser lineal. 

2. Las dos variables, independiente y dependiente, deben estar a escala de intervalo o de 
razón. 

3. Con el criterio de mínimos cuadrados se determina la ecuación de regresión. 

IV. La recta de regresión de mínimos cuadrados es de la forma y = a + bX. 

A. y es el valor estimado de Y para un valor seleccionado de X. 

B. a es la constante o intersección. 

1. Es el valor de Y cuando X = 0. 

2 . a se calcula con la siguiente ecuación. 

a = Y — bX (13-5) 

C. b es la pendiente de la recta ajustada. 

1. Muestra la cantidad de cambio de y ante un cambio de una unidad en X. 

2. Un valor positivo de b indica una relación directa entre las dos variables, y un valor negati- 
vo, una relación inversa. 

3. El signo de ó y el signo de r, el coeficiente de correlación, siempre son iguales. 

4. b se calcula con la siguiente ecuación. 



D. X es el valor de la variable independiente. 

V. En el caso de una ecuación de regresión, se prueba la pendiente para saber su significancia. 

A. Probamos la hipótesis de que la pendiente de la recta en la población es 0. 

1. Si no se rechaza la hipótesis nula, se concluye que no hay relación entre las dos variables. 

2. La prueba es equivalente a la que se realiza para el coeficiente de correlación. 

B. Al probar la hipótesis nula con respecto a la pendiente, el estadístico de prueba es n - 2 gra- 
dos de libertad. 


b - 0 
Sfa 


(13-6) 
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VI. El error estándar de estimación mide la variación alrededor de la recta de regresión. 

A. Está en las mismas unidades que ia variable dependiente. 

B. Se basa en las desviaciones al cuadrado de la recta de regresión. 

C. Los valores pequeños indican que los puntos se concentran estrechamente en la recta de regre- 
sión. 

D. Se calcula utilizando la siguiente fórmula: 


2(V - y) 2 

n - 2 


(13-7) 


Vil. El coeficiente de determinación es la fracción de la variación de una variable dependiente que se 
explica por la variación de la variable independiente. 

A. Varía de 0 a 1 .0. 

B. Es el cuadrado del coeficiente de correlación. 

C. Se calcula a partir de ia siguiente fórmula: 


SSR _ 1 _ SSE 
SS Total ~~ SS Total 


(13-8) 


VIII. La inferencia respecto de la regresión lineal se basa en las siguientes suposiciones. 

A. Para un valor dado de X, los valores de Y están normalmente distribuidos respecto de la recta 
de regresión. 

B. La desviación estándar de cada una de las distribuciones normales es la misma para todos los 
valores de X, y se estima mediante el error estándar de estimación. 

C. Las desviaciones de la recta de regresión son independientes, sin un patrón debido al tamaño o 
la dirección. 

IX. Hay dos tipos de estimaciones de intervalo. 

A. En un intervalo de confianza, el valor medio de Y se estima para un valor dado de X. 

1. Se calcula a partir de la fórmula. 


Y±t(s y . x ) 



(X - X) 2 
2(X - X) 2 


(13-10) 


2. El ancho del intervalo es afectado por el nivel de confianza, el tamaño del error estándar de 
estimación y el tamaño de la muestra, así como por el valor de la variable independiente. 

B. En un intervalo de predicción, el valor individual de Y se estima para un valor dado deX. 

1. Se calcula a partir de la siguiente fórmula. 


V ± fs„ 



(X - Xf 
2(X - X) 2 


(13-11) 


2. La diferencia entre las fórmulas (13-10) y (13-1 1) es el 1 debajo del radical. 

a) El intervalo de predicción será más amplio que el nivel de confianza. 

b) El intervalo de predicción también se basa en el nivel de confianza, el tamaño del error 
estándar de estimación, el tamaño de la muestra y el valor de la variable independiente. 


Clave de pronunciación 

SÍMBOLO SIGNIFICADO 

2Xy Suma de los productos de X y y 

p Coeficiente de correlación 

en la población 

y Valor estimado de Y 


s y . x Error estándar de estimación 

r 2 Coeficiente de determinación 


PRONUNCIACIÓN 

Suma X Y 
Rho 

Y prima 

s subíndice y punto x 
r al cuadrado 
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ejercicios del copítulo 

37 . Una aerolínea comercial seleccionó una muestra aleatoria de 25 vuelos y determinó que la corre- 
lación entre el número de pasajeros y el peso total, en libras, del equipaje almacenado en el com- 
partimento para ello es 0.94. Con el nivel de significancia de 0.05, ¿se puede concluir que hay una 
asociación positiva entre ambas variables? 

38 . Un sociólogo afirma que el éxito de los estudiantes en la universidad (medido por su promedio) se 
relaciona con el ingreso familiar. En una muestra de 20 estudiantes, el coeficiente de correlación 
es 0.40. Con el nivel de significancia de 0.01 , ¿se puede concluir que hay una correlación positiva 
entre las variables? 

39 . Un estudio que realizó la Agencia de Protección Ambiental en 12 automóviles reveló una correla- 
ción de 0.47 entre el tamaño del motor y sus emisiones. Con un nivel de significancia de 0.01 , ¿se 
puede concluir que hay una asociación positiva entre estas variables? ¿Cuál es el valor p? 
Interprete los resultados. 

40 . Un hotel de los suburbios obtiene su ingreso bruto de la renta de sus instalaciones y de su restau- 
rante. Los propietarios tienen interés en conocer la relación entre el número de habitaciones ocu- 
padas por noche y el ingreso por día en el restaurante. En la siguiente tabla se presenta una 
muestra de 25 días (de lunes a jueves) del año pasado que indica el ingreso del restaurante y el 
número de habitaciones ocupadas. 


Día 

Ingreso 

Habitaciones 

ocupadas 

Día 

Ingreso 

Habitaciones 

ocupadas 

1 

$1 452 

23 

14 

$1 425 

27 

2 

1 361 

47 

15 

1 445 

34 

3 

1 426 

21 

16 

1 439 

15 

4 

1 470 

39 

17 

1 348 

19 

5 

1 456 

37 

18 

1 450 

38 

6 

1 430 

29 

19 

1 431 

44 

7 

1 354 

23 

20 

1 446 

47 

8 

1 442 

44 

21 

1 485 

43 

9 

1 394 

45 

22 

1 405 

38 

10 

1 459 

16 

23 

1 461 

51 

11 

1 399 

30 

24 

1 490 

61 

12 

1 458 

42 

25 

1 426 

39 

13 

1 537 

54 





Utilice un paquete de software estadístico para responder las siguientes preguntas. 

a) ¿Parece que aumenta el ingreso por desayunos a medida que aumenta el número de habita- 
ciones ocupadas? Trace un diagrama de dispersión para apoyar su conclusión. 

b) Determine el coeficiente de correlación entre las dos variables. Interprete el valor. 

c) ¿Es razonable concluir que hay una relación positiva entre ingreso y habitaciones ocupadas? 
Utilice el nivel de significancia 0.10. 

d) ¿Qué porcentaje de la variación de los ingresos del restaurante se contabilizan por el número 
de habitaciones ocupadas? 

41 . En la siguiente tabla se muestra el número de automóviles (en millones) vendidos en Estados 
Unidos durante varios años y el porcentaje de ellos que fabricó la compañía General Motors. m 


Año 

Automóviles vendidos Porcentaje de 
(millones) General Motors 

Año 

Automóviles vendidos Porcentaje de 
(millones) General Motors 

1950 

6.0 

50.2 

1980 

11.5 

44.0 

1955 

7.8 

50.4 

1985 

15.4 

40.1 

1960 

7.3 

44.0 

1990 

13.5 

36.0 

1965 

10.3 

49.9 

1995 

15.5 

31.7 

1970 

10.1 

39.5 

2000 

17.4 

28.6 

1975 

10.8 

43.1 

2005 

16.9 

26.9 
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42 . 


43 . 


Utilice un paquete de software estadístico para responder las siguientes preguntas. 

a) ¿El número de automóviles vendidos se relaciona de forma directa o indirecta con el porcenta- 
je del mercado de la General Motors? Trace un diagrama de dispersión para apoyar su conclu- 
sión. 

b) Determine ei coeficiente de correlación entre las dos variables. Interprete el valor. 

c) ¿Es razonable concluir que hay una asociación negativa entre ambas variables? Utilice el nivel 
de significancia 0.01 . 

d) ¿Cuánta variación del mercado de la General Motors se contabiliza debido a la variación del 
número de automóviles vendidos? 

En una muestra de 32 ciudades grandes de Estados Unidos, la correlación entre el número medio 
de pies cuadrados por empleado de oficina y la renta mensual media en el distrito comercial del 
centro es -0.363. Con un nivel de significancia de 0.05, ¿se puede concluir que hay una asocia- 
ción negativa entre las dos variables poblacionales? 

¿Cuál es la relación entre la cantidad gastada por semana en diversión y el tamaño de la familia? 
¿Gastan más en diversión las familias grandes? Una muestra de 10 familias del área de Chicago 
reveló las siguientes cifras por tamaño de familia y cantidad gastada en diversión por semana. 



Tamaño 

familiar 

Cantidad gastada 
en diversión 

Tamaño 

familiar 

Cantidad gastada 
en diversión 

3 

$ 99 

3 

$111 

6 

104 

4 

74 

5 

151 

4 

91 

6 

129 

5 

119 

6 

142 

3 

91 


a) Calcule el coeficiente de correlación. 

¿>) Establezca el coeficiente de determinación. 

c) ¿Existe una asociación positiva entre la cantidad gastada en diversión y el tamaño de la fami- 
lia? Utilice el nivel de significancia 0.05. 

44 . Se selecciona una muestra de 12 casas que se vendieron la semana pasada en St. Paul, 
Minnesota. ¿Se puede concluir que, conforme aumenta el tamaño de la casa (reportado en la 
siguiente tabla en miles de pies cuadrados), también aumenta el precio de venta (reportado en 
miles de dólares)? 


Tamaño de la 
casa (miles de 
pies cuadrados) 

Precio de venta 
(miles de dólares) 

1.4 

100 

1.3 

110 

1.2 

105 

1.1 

120 

1.4 

80 

1.0 

105 


Tamaño de la 
casa (miles de 
pies cuadrados) 

Precio de venta 
(miles de dólares) 

1.3 

110 

0.8 

85 

1.2 

105 

0.9 

75 

1.1 

70 

1.1 

95 


a) Calcule el coeficiente de correlación. 

b) Establezca el coeficiente de determinación. 

c) ¿Existe una asociación positiva entre el tamaño de la casa y su precio de venta? Utilice el nivel 
de significancia 0.05. 

45 . El fabricante de equipo para ejercicio Cardio Glide desea estudiar la relación entre el número de 
meses desde la compra de un aparato y el tiempo que se utilizó el aparato la semana pasada. 


502 


CAPÍTUL0 13 Regresión lineal y correlación 


Persona 

Meses con el equipo 

Horas de uso 

Persona 

Meses con el equipo 

Horas de uso 

Rupple 

12 

4 

Massa 

2 

8 

Malí 

2 

10 

Sass 

8 

3 

Bennett 

6 

8 

Karl 

4 

8 

Longnecker 

9 

5 

Malrooney 

10 

2 

Phillips 

7 

5 

Veights 

5 

5 


a) Trace la información en un diagrama de dispersión. Suponga que las horas de uso son la varia- 
ble dependiente. Comente la gráfica, 
ib) Determine ei coeficiente de correlación. Interprete el resultado. 

c) Con un nivel de significancia de 0.01 , ¿existe una asociación negativa entre las variables? 

46 . La siguiente ecuación de regresión se calculó a partir de una muestra de 20 observaciones: 

Y = 1 5 - 5X 

el resultado para SSE fue 100, y para SS Total, 400. 

a) Determine el error estándar de estimación. 

b) Encuentre el coeficiente de determinación. 

c) Determine el coeficiente de correlación. (Precaución: ¡cuidado con el signo!) 

47 . Los planeadores urbanos piensan que las ciudades más grandes están pobladas por residentes 
de más edad. Para investigar la relación, colectaron datos sobre la población y la edad media en 
10 grandes ciudades. 


Ciudad 

Población 
(en millones) 

Edad media 

Chicago, IL 

2.833 

31.5 

Dallas, TX 

1.233 

30.5 

Houston.TX 

2.144 

30.9 

Los Ángeles, CA 

3.849 

31.6 

Nueva York, NY 

8.214 

34.2 

Phlladelphla, PA 

1.448 

34.2 

Phoenix, AZ 

1.513 

30.7 

San Antonio, TX 

1.297 

31.7 

San Diego, CA 

1.257 

32.5 

San José, CA 

0.930 

32.6 


a) Trace estos datos en un diagrama de dispersión, con la edad media como la variable depen- 
diente. 

ib) Encuentre el coeficiente de correlación. 

c) Se realizó un análisis de regresión, y la ecuación de regresión resultante es Edad media = 31 .4 
+ 0.272 Población. Interprete el significado de la pendiente. 

d) Estime la edad media en una ciudad de 2.5 millones de habitantes. 

e) La siguiente es una fracción de la captura de pantalla del software de la regresión. ¿Qué le dice 
esto? 

Predictor Coef SE Coef T P 

Constante 31.3672 0.6158 50.94 0.000 

Población 0.2722 0.1901 1.43 0.190 

f) Utilizando un nivel de significancia de 0.10, pruebe la significancia de la pendiente. Interprete 
el resultado. ¿Existe una relación significativa entre ambas variables? 

48 . Emily Smith decide comprar un auto que consuma poco combustible. Considera varios vehículos, 
con base en el costo estimado de compra y la edad del vehículo. 
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Vehículo 

Costo estimado 

Edad 

Honda Insight 

$5 555 

8 

Toyota Prius 

$17 888 

3 

Toyota Prius 

$9 963 

6 

Toyota Echo 

$6 793 

5 

Honda Civic Hybrid 

$10 774 

5 

Honda Civic Hybrid 

$16 310 

2 

Chevrolet Prizm 

$2 475 

8 

Mazda Protege 

$2 808 

10 

Toyota Corolla 

$7 073 

9 

Acura Integra 

$8 978 

8 

Scion xB 

$11 213 

2 

Scion xA 

$9 463 

3 

Mazda3 

$15 055 

2 

Mini Cooper 

$20 705 

2 


a) Trace estos datos en un diagrama de dispersión, con el costo estimado como la variable de- 
pendiente. 

b) Calcule el coeficiente de correlación. 

c) Se realizó un análisis de regresión y la ecuación de regresión resultante es Costo estimado = 
18358 - 1534 Edad. Interprete el significado de la pendiente. 

d) Calcule el costo de un auto de cinco años. 

e) La siguiente es una fracción de la captura de pantalla del software de la regresión. ¿Qué le dice 
esto? 

Predictor Coef SE Coef T P 

Constante 18358 1817 10.10 0.000 

Población -1533.6 306.3 -5.01 0.000 

f) Utilizando un nivel de significancia de 0.10, pruebe la significancia de la pendiente. Interprete 
el resultado. ¿Existe una relación significativa entre ambas variables? 

49 . La National Highway Association estudia la relación entre el número de licitadores en un proyecto 
para una carretera y la licitación más alta (menor costo) del proyecto. De interés particular resulta 
saber si el número de licitadores aumenta o disminuye la cantidad de la oferta ganadora. m 


Proyecto 

Número de 
licitadores, X 

Oferta ganadora 
(millones de 
dólares), Y 

Proyecto 

Número de 
licitadores, X 

Oferta ganadora 
(millones de 
dólares), Y 

1 

9 

5.1 

9 

6 

10.3 

2 

9 

8.0 

10 

6 

8.0 

3 

3 

9.7 

11 

4 

8.8 

4 

10 

7.8 

12 

7 

9.4 

5 

5 

7.7 

13 

7 

8.6 

6 

10 

5.5 

14 

7 

8.1 

7 

7 

8.3 

15 

6 

7.8 

8 

11 

5.5 





a) Determine la ecuación de regresión. Interprete la ecuación. ¿Más licitadores tienden a aumen- 
tar o a disminuir la cantidad de la oferta ganadora? 

b) Estime la cantidad de la oferta ganadora si se hubieran presentado siete licitadores. 

c) Se desea construir una nueva entrada en la carretera Ohio Turnpike. Se presentaron siete lici- 
tadores. Determine un intervalo de predicción de 95% de la oferta ganadora. 

d) Determine el coeficiente de determinación. Interprete su valor. 

50 . El señor William Profit estudia compañías que se hacen públicas por primera vez. Le interesa en 
particular la relación entre el tamaño de la oferta y el precio por acción. Una muestra de 15 com- 
pañías que recién se hicieron públicas reveló la siguiente información. m 
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Compañía 

Tamaño (en 
millones de 
dólares), X 

Precio 
por acción, 

Y 

Compañía 

Tamaño (en 
millones de 
dólares), X 

Precio 
por acción, 

Y 

1 

9.0 

10.8 

9 

160.7 

11.3 

2 

94.4 

11.3 

10 

96.5 

10.6 

3 

27.3 

11.2 

11 

83.0 

10.5 

4 

179.2 

11.1 

12 

23.5 

10.3 

5 

71.9 

11.1 

13 

58.7 

10.7 

6 

97.9 

11.2 

14 

93.8 

11.0 

7 

93.5 

11.0 

15 

34.4 

10.8 

8 

70.0 

10.7 





a) Determine la ecuación de regresión. 

ib) Haga una prueba para determinar si el deslizamiento de la regresión lineal es positivo, 
c) Establezca el coeficiente de determinación. ¿Considera que el señor Profit debe estar satisfe- 
cho con el tamaño de ia oferta como variable independiente? 

51 . Bardi Trucking Co., ubicada en Cleveland, Ohio, hace entregas en ia región de los Grandes Lagos, 
en el lado sur y en el lado norte. Jim Bardi, el presidente, estudia la relación entre la distancia de 
recorrido de un embarque y el tiempo, en días, que dura en llegar a su destino. Para investigar esta 
cuestión, el señor Bardi seleccionó una muestra aleatoria de 20 embarques del mes pasado. La 
distancia de envío es la variable independiente y el tiempo de envío es la variable dependiente. Los 
resultados son los siguientes: 


Embarque 

Distancia 

(millas) 

Tiempo de 
envío (días) 

Embarque 

Distancia 

(millas) 

Tiempo de 
envió (días) 

1 

656 

5 

11 

862 

7 

2 

853 

14 

12 

679 

5 

3 

646 

6 

13 

835 

13 

4 

783 

11 

14 

607 

3 

5 

610 

8 

15 

665 

8 

6 

841 

10 

16 

647 

7 

7 

785 

9 

17 

685 

10 

8 

639 

9 

18 

720 

8 

9 

762 

10 

19 

652 

6 

10 

762 

9 

20 

828 

10 


a) Trace un diagrama de dispersión. Con base en estos datos, ¿parece haber una relación entre 
la cantidad de millas que debe recorrer el embarque y el tiempo que tarda en llegar a su desti- 
no? 

b) Determine el coeficiente de correlación. ¿Es posible concluir que hay una correlación positiva 
entre la distancia y el tiempo? Utilice el nivel de significancia 0.05. 

c) Establezca e interprete el coeficiente de determinación. 

d) Determine el error estándar de estimación. 

e) ¿Recomendaría aplicar la ecuación de regresión para predecir el tiempo de envío? Diga por qué 
sí o por qué no. 

52 . Super Markets, Inc., considera ampliarse hasta el área de Scottsdale, Arizona. Usted, como direc- 
tor de planeación, debe presentar un análisis de la ampliación propuesta al comité de operación 
de la junta de directores. Como parte de su propuesta, necesita incluir información sobre ia canti- 
dad que gastan por mes en abarrotes las personas de la región. Tal vez debería incluir información 
sobre la relación entre la cantidad gastada en abarrotes y el ingreso. Su asistente reunió la siguien- 
te información muestral. 
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Hogar 

Cantidad gastada 

Ingreso mensual 

1 

$ 555 

$4 388 

2 

489 

4 558 

39 

1 206 

9 862 

40 

1 145 

9 883 


a) Sea la cantidad gastada la variable dependiente y el ingreso mensual la variable independien- 
te. Trace un diagrama de dispersión con un paquete de software estadístico, 
ib) Determine la ecuación de regresión. Interprete el valor de la pendiente, 
c) Determine el coeficiente de correlación. ¿Puede concluir que es mayor que 0? 

53 . En la siguiente tabla se muestra información sobre el precio por acción y el dividendo de una 
muestra de 30 compañías. Los datos muéstrales se encuentran en el disco que se proporciona 
con este libro. 


Compañía 

Precio por acción 

Dividendo 

1 

$20.00 

$3.14 

2 

22.01 

3.36 

29 

77.91 

17.65 

30 

80.00 

17.36 


a) Calcule la ecuación de regresión usando el precio de venta con base en el dividendo anual. 
Interprete el valor de la pendiente. 

b) Pruebe la significancia de la pendiente. 

c) Encuentre el coeficiente de determinación. Interprete su valor. 

d) Determine el coeficiente de correlación. Con un nivel de significancia de 0.05, ¿puede concluir 
que su valor es mayor que 0? 

54 . Un empleado de carreteras realizó un análisis de regresión de la relación entre el número de acci- 
dentes fatales en zonas de construcción y el número de desempleados en el estado. La ecuación de 
regresión es Accidentes fatales = 12.7 + 0.0001 14 (Desempleados) Algunos datos adicionales son: 


Factor de 
pronóstico 


Coef 

SE Coef 

T 

P 

Constante 


12 . 726 

8 . 115 

1 . 57 

0 . 134 

Desempleados 

0 . 

00011386 

0 . 00002896 

3 . 93 

0 . 001 

Análisis de 

la 

varianza 



Fuente 


DF 

SS MS 

F 

P 

Regresión 


1 

10354 10354 

15.46 

0 . 001 

Error residual 

18 

12054 670 



Total 


19 

22408 




a) ¿Cuántos estados había en la muestra? 

b) Determine el error estándar de estimación. 

c) Encuentre el coeficiente de determinación. 

d) Determine el coeficiente de correlación. 

e) Con un nivel de significancia de 0.05, ¿sugiere la evidencia que hay una asociación positiva 
entre los accidentes fatales y el número de desempleados? 

55 . El siguiente es un análisis de regresión que relaciona el valor actual de mercado en dólares con el 
tamaño en pies cuadrados de casas de Greene County, Tennessee. La ecuación de regresión es: 
Valor = -37.186 + 65.0 Tamaño. 


Coeficiente 









de pronóstico 

Coef 

SE Coef 


T 


P 



Constante —3 

7186 

4629 

-8 

03 

0 

000 



Tamaño 6 4 

. 993 

3 . 047 

21 

33 

0 

000 



Análisis de la 

varianza 







Fuente 

DF 


SS 



MS 

F 

P 

Regresión 

1 

13548662082 


13548 

662082 

454 . 98 

0 . 000 

Error residual 

33 

982687392 


29778406 



Total 

34 

14531349474 
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a) ¿Cuántas casas había en la muestra? 
ib) Calcule el error estándar de estimación. 

c) Calcule el coeficiente de determinación. 

d) Calcule el coeficiente de correlación. 

e) Con un nivel de significancia de 0.05, ¿la evidencia sugiere una asociación positiva entre el 
valor de mercado de las casas y el tamaño de la casa en pies cuadrados? 

56 . En la siguiente tabla se muestra el interés porcentual anual del capital (rentabilidad) y el crecimien- 
to porcentual anual medio de las ventas de ocho compañías aeroespaciales y de la defensa. ^ A 


Compañía 

Rentabilidad 

Crecimiento 

Alliant Techsystems 

23.1 

8.0 

Boeing 

13.2 

15.6 

General Dynamics 

24.2 

31.2 

Honeywell 

11.1 

2.5 

L-3 Communications 

10.1 

35.4 

Northrop Grunmman 

10.8 

6.0 

Rockwell Collins 

27.3 

8.7 

United Technologies 

20.1 

3.2 


a) Calcule el coeficiente de correlación. Realice una prueba de hipótesis para determinar si es 
razonable concluir que la correlación entre la población es mayor que 0. Utilice el nivel de sig- 
nificancia 0.05. 

ib) Elabore la ecuación de regresión de la rentabilidad con base en el crecimiento. ¿Podemos con- 
cluir que la pendiente de la recta de regresión es negativa? 
c) Utilice un paquete de software estadístico para determinar el residual de cada observación. 
¿Qué compañía tiene el residual mayor? 

57 . En los siguientes datos aparece el precio al menudeo de 12 computadoras portátiles, selecciona- 
das al azar, junto con sus velocidades de procesador correspondientes en gigahertz. ai 


Computadora 

Velocidad 

Precio 

1 

2.0 

$2 017 

2 

1.6 

922 

3 

1.6 

1 064 

4 

1.8 

1 942 

5 

2.0 

2 137 

6 

1.2 

1 012 


Computadora 

Velocidad 

Precio 

7 

2.0 

$2 197 

8 

1.6 

1 387 

9 

2.0 

2 114 

10 

1.6 

2 002 

11 

1.0 

937 

12 

1.4 

869 


a) Elabore una ecuación lineal que sirva para describir cómo depende el precio de la velocidad del 
procesador. 

ib) Con base en su ecuación de regresión, ¿hay alguna computadora que parezca tener, de mane- 
ra particular, un precio menor o mayor? 

c) Calcule el coeficiente de correlación entre dos variables. Con un nivel de significancia de 0.05 
realice una prueba de hipótesis para determinar si la correlación de la población puede ser 
mayor que 0. 

58 . Una cooperativa de compras para el consumidor probó el área de calefacción efectiva de 20 
calentadores eléctricos distintos, con consumos, en vatios, distintos. Los resultados son los 
siguientes. 


Calentador 

Vatios 

Area 

1 

1 500 

205 

2 

750 

70 

3 

1 500 

199 

4 

1 250 

151 

5 

1 250 

181 

6 

1 250 

217 

7 

1 000 

94 

8 

2 000 

298 

9 

1 000 

135 

10 

1 500 

211 


Calentador 

Vatios 

Area 

11 

1 250 

116 

12 

500 

72 

13 

500 

82 

14 

1 500 

206 

15 

2 000 

245 

16 

1 500 

219 

17 

750 

63 

18 

1 500 

200 

19 

1 250 

151 

20 

500 

44 


Ejercicios del capítulo 
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a) Calcule la correlación entre consumo en vatios y área de calefacción. ¿Existe una relación 
directa o indirecta? 

ib) Realice una prueba de hipótesis para determinar si es razonable que el coeficiente sea mayor 
que 0. Utilice el nivel de significancia 0.05. 

c) Elabore la ecuación de regresión del calentamiento efectivo con base en el consumo en vatios. 

d) ¿Qué calentador parece la “mejor compra” con base en el tamaño del residuo? 

59 . Un entrenador de perros investiga ia relación entre el tamaño del can (peso en libras) y su consu- 
mo alimentario diario (medido en tazas estándar). El resultado de una muestra de 18 observacio- 
nes es el siguiente: 


Can 

Peso 

Consumo 

Can 

Peso 

Consumo 

1 

41 

3 

10 

91 

5 

2 

148 

8 

11 

109 

6 

3 

79 

5 

12 

207 

10 

4 

41 

4 

13 

49 

3 

5 

85 

5 

14 

113 

6 

6 

111 

6 

15 

84 

5 

7 

37 

3 

16 

95 

5 

8 

111 

6 

17 

57 

4 

9 

41 

3 

18 

168 

9 


a) Calcule el coeficiente de correlación. ¿Es razonable concluir que la correlación entre la pobla- 
ción es mayor que 0? Utilice el nivel de significancia 0.05. 
ib) Elabore la ecuación de regresión de las tazas con base en el peso del can. ¿Cuánto cambia el 
peso estimado del perro cada taza adicional de alimento? 
c) ¿Come demasiado o come menos uno de los perros? 

60 . La Waterbury Insurance Company desea estudiar la relación entre la cantidad de daño por fuego, 
la distancia entre la casa ardiendo y la estación de bomberos más cercana. Esta información se 
empleará en el ajuste de la cobertura del seguro. Mediante una muestra de 30 demandas durante 
el año pasado, el director del departamento de actuarios determinó la distancia de la estación de 
bomberos (X) y la cantidad de daños, en miles de dólares (Y). A continuación se presenta la cap- 
tura de pantalla de MegaStat. 


Tabla ANOVA 




Fuente 

SS 

df MS 

F 

Regresión 

1, 864 . 5782 

1 1,864.5782 

38.83 

Residuo 

1,344.4934 

28 48.0176 


Total 

3,209.0716 

29 


Salida de la 

regresión 



Variables 

Coef f icients 

Std. Error 

t (df = 28) 

Intersección 

12.3601 

3.2915 

3 . 755 

Distancia-X 

4 . 7956 

0.7696 

6.231 


Responda las siguientes preguntas. 

a) Elabore la ecuación de regresión. ¿Hay una relación directa o indirecta entre la distancia de la 
estación de bomberos y la cantidad de daño? 

b) ¿Cuánto daño estimaría que provoca un incendio situado a 5 millas de la estación de bombe- 
ros más cercana? 

c) Encuentre e interprete el coeficiente de determinación. 

d) Determine el coeficiente de correlación. Interprete su valor. ¿Cómo determinó el signo del coe- 
ficiente de correlación? 

e) Realice una prueba de hipótesis para determinar si hay una relación significativa entre la dis- 
tancia a la estación de bomberos y la cantidad de daño. Utilice el nivel de significancia de 0.01 
y una prueba de dos colas. 
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28 

29 
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CAPÍTUL0 13 Regresión lineal y correlación 


61. A continuación se presentan las películas con las ventas mundiales en taquilla más altas y su pre- 
supuesto (cantidad total disponible para hacer la película). Sffj 


Película 


Avatar 

Titanio 

El señor de los anillos: El regreso del rey 

Piratas del Caribe: El cofre del muerto 

Alicia en el país de las Maravillas 

El caballero de la noche 

Harry Potter y la piedra del hechicero 

Piratas del Caribe: El fin del mundo 

Harry Potter y la Orden del Fénix 

Harry Potter y el misterio del príncipe 

Guerra de las Galaxias: Episodio I: La amenaza fantasma 

TEI señor de los anillos: Las dos torres 

Parque Jurásico 

Shrek 2 

Harry Potter y el cáliz de fuego 
Edad del hielo: El fin de los dinosaurios 
Hombre Araña 3 

Harry Potter y la cámara secreta 

El señor de los anillos: La sociedad del anillo 

Buscando a Nemo 

Guerra de las Galaxias: Episodio III: La venganza de los Sith 

Día de la Independencia 

Hombre Araña 

Guerra de las galaxias 

Harry Potter y el prisionero de Azkabán 

Hombre Araña 2 

El rey león 

E.T. 

Matrix Reloaded 
Forrest Gump 
Sexto sentido 
Piratas del Caribe 

Guerra de las galaxias: Episodio II: El ataque de los clones 

Los Increíbles 

El mundo perdido 

La Pasión de Cristo 

Hombres de negro 

El regreso del Jedi 

Misión imposible 2 

El imperio contraataca 

Mi pobre angelito 

Monsters, Inc. 

La sombra del amor (Ghost) 

Conoce a los Fockers 

Aladino 

Tornado 

Toy Story 2 

Salvando al soldado Ryan 

Tiburón 

Shrek 


Taquilla Presupuesto 

Año (millones) ajustado (millones) 


2009 

2 729.7 

237.0 

1997 

1 835.0 

789.3 

2003 

1 129.2 

377.0 

2006 

1 060.6 

321.4 

2010 

1 017.3 

200.0 

2008 

1 001.9 

185.0 

2001 

968.7 

338.3 

2007 

958.4 

308.9 

2007 

937.0 

306.3 

2009 

934.0 

382.2 

1999 

925.5 

511.7 

2002 

920.5 

354.0 

1993 

920.0 

513.8 

2004 

912.0 

436.5 

2005 

892.2 

300.8 

2009 

886.7 

380.4 

2007 

885.4 

354.0 

2002 

866.4 

272.4 

2001 

860.7 

334.3 

2003 

853.2 

339.7 

2005 

848.5 

278.0 

1996 

813.1 

417.5 

2002 

806.7 

419.7 

1977 

797.9 

1 084.3 

2004 

789.8 

249.4 

2004 

784.0 

373.4 

1994 

771.9 

446.2 

1982 

757.0 

860.6 

2003 

735.7 

281.5 

1994 

680.0 

470.2 

1999 

661.5 

348.4 

2003 

653.2 

305.4 

2002 

648.3 

323.0 

2004 

631.2 

261.4 

1997 

614.4 

301.0 

2004 

611.8 

370.3 

1997 

587.2 

328.6 

1983 

573.0 

563.1 

2000 

545.4 

241.0 

1980 

533.9 

586.8 

1990 

533.8 

401.6 

2001 

524.2 

272.6 

1990 

517.6 

306.6 

2004 

511.9 

279.2 

1992 

502.4 

311.7 

1996 

495.0 

329.7 

1999 

485.7 

291.8 

1998 

479.3 

278.1 

1975 

471.0 

782.7 

2001 

469.7 

285.1 


Encuentre la correlación entre el presupuesto mundial y las ventas en taquilla mundiales. Comente 
sobre la asociación entre ambas variables. ¿Parece que las películas con presupuestos mayores 
obtienen ingresos en taquilla elevados? 


Ejercicios de la base de datos 
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Ejercicios de lo base de datos 

62. Consulte los datos de bienes raíces, donde se reporta información sobre casas vendidas en 
Goodyear, Arizona, el año pasado. 

a) Sea el precio de venta la variable dependiente, y el tamaño de la casa, la variable independien- 
te. Determine la ecuación de regresión. Estime el precio de venta de una casa con un área de 
2 200 pies cuadrados. Determine el intervalo de confianza de 95% y el intervalo de predicción 
de 95% del precio de venta de una casa con área de 2 200 pies cuadrados. 

£>) Sea el precio de venta la variable dependiente, y la distancia desde el centro de la ciudad, la 
variable independiente. Determine la ecuación de regresión. Estime el precio de venta de una 
casa a 20 millas del centro de la ciudad. Encuentre el intervalo de confianza de 95% y el inter- 
valo de predicción de 95% de las casas a 20 millas del centro de la ciudad, 
c) ¿Puede concluir que las variables independientes “distancia desde el centro de la ciudad” y 
“precio de venta” se correlacionan en forma negativa, y que el área de la casa y el precio de 
venta se correlacionan en forma positiva? Utilice el nivel de significancia de 0.05. Reporte el 
valor p de la prueba. Resuma sus resultados en un breve reporte. 

63. Consulte los datos de Baseball 2009, donde se reporta información sobre la temporada 2009 de 
la Liga Mayor. Sean los juegos ganados la variable dependiente, y el salario total del equipo, en 
millones de dólares, la variable independiente. Determine la ecuación de regresión y conteste las 
siguientes preguntas. 

a) Trace un diagrama de dispersión. Con base en ese diagrama, ¿parece haber una relación direc- 
ta entre ambas variables? 

b) ¿Cuántas victorias estimaría para un salario de 100.0 millones? 

c) Cuántas victorias adicionales traería un salario de 5 millones adicionales? 

d) A un nivel de significancia de 0.05, ¿se puede concluir que la pendiente de la recta de regre- 
sión es positiva? Realice la prueba de hipótesis correspondiente. 

e) ¿Qué porcentaje de la variación de victorias representa el salario? 

f) Determine la correlación entre victorias y el promedio de bateo por equipo, y entre las victorias 
y el promedio de carreras. ¿Cuál es más fuerte? Realice la correspondiente prueba de la hipó- 
tesis para cada grupo de variables. 

64. Consulte los datos de los autobuses escolares del Distrito Escolar Buena. Desarrolle una ecuación 
de regresión que exprese la relación entre la edad del autobús como variable independiente, y el 
mantenimiento. 

a) Trace un diagrama de dispersión. ¿Qué sugiere el diagrama con respecto a la relación entre las 
dos variables? ¿Es directa o indirecta? ¿Fuerte o débil? 

b) Desarrolle una ecuación de regresión. ¿Cuánto añade al mantenimiento un año más de vida? 
¿Cuál es el costo estimado de mantenimiento de un camión de diez años de edad? 

c) Realice una prueba de hipótesis para determinar si la pendiente de la recta de regresión es 
mayor a cero. Utilice el nivel de significancia de 0.05. Interprete sus resultados de los incisos 
a), b) y c) en un breve reporte. 
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CAPÍTULO 13 Regresión lineal y correlación 


Comandos de software 

1. Los comandos en Minitab para la captura de pantalla que 
muestra el coeficiente de correlación de la página 474 son: 

a) Escriba el nombre del representante de ventas en C7, el 
número de llamadas en C2 y el de las ventas en C3. 

b) Seleccione Stat, Basic Statistics y Correlation. 

c) Seleccione Calis y Unlts Sold como las variables, haga 
clic en Display p-values, y luego haga clic en OK. 



2. Los comandos para la captura de pantalla de Excel de la 

página 487 son: 

a) Escriba los nombres de las variables en la fila 1 de las 
columnas A, B y C. Escriba los datos en las filas 2 a 1 1 
en las mismas columnas. 

b) Seleccione Data en la barra de herramientas. En el 
extremo derecho, seleccione Data analysis, Regres- 
sion y haga clic en OK. 

c) Para la hoja de cálculo tiene Calis en la columna B y 
Sales en la columna C. El Input Y-Range es C1:C1 1, y 
el Input X-Range, B1:B11. Haga clic en Labels, selec- 
cione El como Output Range, y haga clic en OK. 
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3. Los comandos en Minitab para los intervalos de confianza y 

de predicción de la página 494 son: 

a) Seleccione Stat, Regresión y Fitted Une plot. 

b) En el siguiente cuadro de diálogo la Response (Y) es 
Sales, y el Predictor (X) es Calis. Seleccione Linear 
para el tipo de modelo de regresión y luego haga clic en 
Options. 

c) En el cuadro de diálogo Options haga clic en Display 
confidence and prediction bands, utilice 95.0 para el 
nivel de confianza y en el cuadro Title escriba el enca- 
bezado apropiado; luego haga clic en OK y en OK otra 
vez. 



Respuestas a las autoevaluaciones 
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Capítulo 13 


Respuestas a las autoevaluaciones 



13-1 


a) Los gastos en publicidad son la variable independien- 
te, y el ingreso por ventas, la dependiente. 



X 

Y (X - X) (X - X) 2 (Y - Y) (Y- Y) 2 (X - 

X)(Y- Y) 

2 

1 

-0.5 

.25 

0 

0 

0 

1 

3 

-1.5 

2.25 

-4 

16 

6 

3 

8 

0.5 

.25 

1 

1 

0.5 

4 

10 

1.5 

2.25 

3 

9 

4.5 

10 

28 


5.00 


26 

11.0 


x = ^ = 2.5 

4 


Y=^ = 7 
4 


= 1 .2909944 



2.9439203 


13-3 a) Vea los cálculos en autoevaluación 13-1, inciso c). 

rs y (0.9648X2.9439) 
s x 1.2910 


a = 



= 7 - 5.5 = 


1.5 


b) La pendiente es 2.2. Esto indica que un aumento de 
$1 millón en publicidad generará un aumento de $2.2 
millones en las ventas. La intersección es 1 .5. Si no 
hubiera gastos en publicidad, las ventas serían $1.5 
millones. 

c) Y = 1.5 + 2.2(3) = 8.1 


13-4 H 0 : 3! < 0; H{. 3 > 0, rechaza H 0 si f > 3.182. 


2.2 - 0 
0.42 


5.238 


Rechace H 0 . La recta de la pendiente es mayor a cero. 

13-5 a) 


Y 

Y 

1 

(Y- Y) 2 

7 

5.9 

i.i 

1.21 

3 

3.7 

-0.7 

.49 

8 

8.1 

-0.1 

.01 

10 

10.3 

-0.3 

.09 




1.80 


2(Y - Y) ¿ 



= .9487 


b) r 2 = (,9487) 2 = .90 

c) Los gastos de publicidad representan 90% de la varia- 
ción de las ventas. 


_ 2(X-X)(Y- Y) _ 11 

r ~ (n - 1)s x s y “ (4-1 )(1 ,2909944)(2.9439203) 

= 0.9648 

d) Hay una correlación fuerte entre los gastos de publici- 
dad y las ventas. 

13-2 H 0 \ p < 0, Hp p > 0. H 0 se rechaza si f > 1.714. 


.43V25 - 2 
VI - (.43) 2 


2.284 


H 0 se rechaza. Hay una correlación positiva entre el por- 
centaje de los votos recibidos y la cantidad que se gastó 
en la campaña. 


13-6 6.58 y 9.62, dado que Y para una X de 3 es 8.1 , calculado 
por: 

Y = 1.5 + 2.2(3) = 8.1 , entonces X = 2.5 y 
2(X - X) 2 = 5. 

t del apéndice B.2 para 4-2 = 2 grados de libertad con 
el nivel 0.10 es 2.920. 


Y±t(s y . x ) 


1 (X - X) 2 
n + 2(X - X) 2 


1 f3 2 51 2 

= 8.1 ± 2. 920(0.9487) J- + g ' ' 

= 8.1 ± 2. 920(0. 9487)(0. 5477) 

= 6.58 y 9.62 (en millones de dólares) 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Análisis de correlación 
y regresión múltiple 


OA1 Describir la relación 
entre diversas variables 
Independientes y una variable 
dependiente mediante el 
análisis de regresión múltiple. 

OA2 Elaborar, Interpretar y 
aplicar una tabla ANOVA. 

OA3 Calcular e Interpretar 
medidas de asociación de la 
regresión múltiple. 

OA4 Realizar una prueba de 
hipótesis para determinar si 
los coeficientes de regresión 
difieren de cero. 

OA5 Realizar una prueba de 
hipótesis de cada uno de los 
coeficientes de regresión. 

OA6 Utilizar el análisis 
residual para evaluar las 
suposiciones del análisis de 
regresión múltiple. 

OA7 Evaluar los efectos de 
las variables independientes 
correlacionadas. 

OA8 Evaluar y utilizar 
variables Independientes 
cualitativas. 

OA9 Comprendere 
interpretar la posible 
interacción entre variables 
independientes. 

OAIO Explicar la regresión 
por pasos. 



El departamento de préstamos hipotecarios del Bank of New England, 
estudia datos de préstamos recientes. Resultando de interés particular 
factores como el valor de la casa, el nivel de educación del prestatario, 
su edad, el pago hipotecario mensual y su género se relacionan con el 
ingreso familiar. ¿Estas variables son factores eficaces de predicción de 
la variable dependiente del ingreso familiar? (Consulte el 
Ejemplo/Solución en la sección 14.9 y el objetivo 1.) 



14.2 Análisis de regresión múltiple 
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0A1 Describir la relación 
entre diversas variables 
independientes y una variable 
dependiente mediante el 
análisis de regresión múltiple. 


14.1 Introducción 

En el capítulo 13, se describió la relación entre un par de variables en escala de intervalo o de 
razón. Este capítulo comienza con el estudio del coeficiente de correlación, el cual mide la 
fuerza de una relación. Un coeficiente cercano a más o menos 1 .00 (por ejemplo, —0.88 o 0.78) 
indica una relación lineal muy fuerte, en tanto que un valor cercano a 0 (por ejemplo, —0.12 o 
0.18) significa que la relación es débil. A continuación se desarrolla un procedimiento para 
determinar una ecuación lineal con la cual expresar la relación entre las dos variables. A este 
procedimiento se le denominó recta de regresión. Esta recta describe la relación entre las 
variables. También describe el patrón general de una variable dependiente (V) de una variable 
independiente o variable de explicación (X). 

En la correlación y regresión lineal múltiple, se emplean variables independientes adicio- 
nales (denotadas X 1: X 2 , ..., X n ) que ayudan a explicar o predecir mejor a la variable depen- 
diente (Y). Casi todas las ideas estudiadas en la correlación y regresión lineal simple se 
amplían a esta situación más general. Sin embargo, las variables independientes adicionales 
permiten hacer algunas consideraciones nuevas. El análisis de regresión múltiple sirve como 
técnica descriptiva o como técnica de inferencia. 


14,2 Análisis de regresión múltiple 

La forma descriptiva general de una ecuación lineal múltiple se muestra en la fórmula (14-1). 
Se utiliza k para representar el número de variables independientes. Por lo tanto, k puede ser 
cualquier número entero positivo. 


ECUACIÓN GENERAL DE 

REGRESIÓN MÚLTIPLE Y - a + + b 2 X 2 + b 3 X 3 + ■ ■ ■ + b k X k 


( 14 - 1 ) 


y 


donde: 

a es la intersección, el valor de Y cuando todas las X son cero. 

b¡ es la cantidad en que Y cambia cuando esaXy particular aumenta una unidad, cuando 
los valores de todas las demás variables independientes se mantienen constantes. El 
subíndice j es sólo un identificador de cada variable independiente; no se emplea en los 
cálculos. En general, el subíndice es un número entero entre 1 y k, el cual es el núme- 
ro de variables independientes. Sin embargo, el subíndice también puede ser un iden- 
tificador breve o abreviado. Por ejemplo, la edad puede servir como un subíndice. 

En el capítulo 13, en el análisis de regresión se describió y probó la relación entre una variable 
dependiente, Y, y una sola variable independiente, X. La relación entre Y y X se representa en 
forma gráfica mediante una recta. Cuando hay dos variables independientes, la ecuación de 
regresión es 


Y = a + biX, + b 2 X 2 

Como hay dos variables independientes, esta relación se representa de forma gráfica como un 
plano, y se muestra en la gráfica 14-1 . En la gráfica se presentan los residuos como la diferen- 
cia entre la Y real y la Y ajustada en el plano. Si un análisis de regresión múltiple incluye más 
de dos variables independientes, no se puede emplear una gráfica para ilustrar el análisis, ya 
que las gráficas están limitadas a tres dimensiones. 

Para ilustrar la interpretación de la intersección y los dos coeficientes de regresión, supon- 
ga que el rendimiento por galón de combustible de un vehículo tiene una relación directa con 
el octanaje de la gasolina (X-i) y una inversa con el peso del automóvil (X 2 ). Suponga que la 
ecuación de regresión, calculada con software estadístico, es: 


Y = 6.3 + 0.2X, - 0.001X 2 
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GRÁFICA 14-1 



El valor de la intersección de 6.3 indica que la ecuación de regresión intersecta el eje Y en 
6.3 cuando X-, y X 2 son ceros. Por supuesto, no tiene ningún sentido físico poseer un automó- 
vil que no tenga peso (cero) y utilice gasolina sin octanaje. Es importante tener en cuenta que, 
en general, una ecuación de regresión no se utiliza fuera del rango de los valores muéstrales. 

El valor ó-, de 0.2 Indica que, por cada aumento de 1 en el contenido de octanos de la 
gasolina, el automóvil recorrería 2/10 de una milla por galón, sin importar el peso del automó- 
vil. El valor b 2 de —0.001 revela que, por cada aumento de una libra en el peso del vehículo, 
el número de millas recorridas por galón disminuye en 0.001 , sin importare! contenido de octa- 
nos de la gasolina. 

Como ejemplo, un automóvil con gasolina de 92 octanos en el depósito de combustible y 
con un peso de 2 000 libras recorrería un promedio de 22.7 millas por galón, calculado por: 

Y= a + b 1 X 1 + b 2 X 2 = 6.3 + 0.2(92) - 0.001(2 000) = 22.7 

Los valores de los coeficientes de la ecuación lineal múltiple se determinan mediante el 
método de mínimos cuadrados. Recuerde del capítulo anterior, que el método de mínimos 
cuadrados suma las diferencias elevadas al cuadrado entre los valores ajustados y reales de 
Y tan pequeña como sea posible, con lo cual el término se minimiza. Los cálculos son muy 
tediosos, por lo que suelen realizarse mediante un paquete de software estadístico, como 
Excel o Minitab. 

En el siguiente ejemplo se muestra un análisis de regresión múltiple con tres variables 
independientes mediante Excel y Minitab. Los dos paquetes arrojan un conjunto estándar de 
estadísticas y reportes. Sin embargo, Minitab también incluye técnicas de análisis de regresión 
avanzadas que se utilizarán más adelante en este capítulo. 


Cjemplo 


Salsberry Realty vende casas en la costa este de Estados Unidos. Una de las preguntas más 
frecuentes de los compradores potenciales es: si compramos esta casa, ¿cuánto gastaremos 
en calefacción durante el invierno? Al departamento de investigación de Salsberry se le pidió 
desarrollar algunas directrices respecto de los costos de calefacción de casas unifamiliares. Se 
considera que tres variables se relacionan con dichos costos: 1) la temperatura externa diaria 
media, 2) el número de pulgadas de aislamiento en el ático y 3) los años de uso del calentador. 
Para el estudio, el departamento de investigación de Salsberry seleccionó una muestra aleato- 
ria de 20 casas de venta reciente. Determinó el costo de calefacción de cada casa en enero 
pasado, así como la temperatura externa en enero en la región, el número de pulgadas de ais- 
lamiento del ático y los años de uso del calentador. La información muestral se reporta en la 
tabla 14-1. 
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Estadística en acción 

Muchos estudios indican 
que una mujer ganará 
cerca de 70% de lo que 
ganaría un hombre en el 
mismo puesto. 
Investigadores de la 
University of Michigan 
Institute for Social 
Research determinaron 
que alrededor de un ter- 
cio de la diferencia se 
explica por factores socia- 
les, como diferencias en 
educación, experiencia e 
interrupciones en el tra- 
bajo. Los dos tercios res- 
tantes no se explican por 
estos factores sociales. 

V 


Solución 


TABLA 1 4-1 Factores del costo de calefacción en enero de una muestra de 20 casas 


Casa 

Costo de 
calefacción ($) 

Temperatura externa 
media (°F) 

Aislamiento del 
ático (pulgadas) 

Antigüedad del 
calentador (años) 

1 

$250 

35 

3 

6 

2 

360 

29 

4 

10 

3 

165 

36 

7 

3 

4 

43 

60 

6 

9 

5 

92 

65 

5 

6 

6 

200 

30 

5 

5 

7 

355 

10 

6 

7 

8 

290 

7 

10 

10 

9 

230 

21 

9 

11 

10 

120 

55 

2 

5 

11 

73 

54 

12 

4 

12 

205 

48 

5 

1 

13 

400 

20 

5 

15 

14 

320 

39 

4 

7 

15 

72 

60 

8 

6 

16 

272 

20 

5 

8 

17 

94 

58 

7 

3 

18 

190 

40 

8 

11 

19 

235 

27 

9 

8 

20 

139 

30 

7 

5 


Los datos de la tabla 14-1 están disponibles en formato de Excel y Minitab en el sitio web 
del libro, www.mhhe.com/lind15e. Las instrucciones básicas de Excel y Minitab para aprove- 
char estos datos se encuentran en la sección de comandos de software, al final de este capí- 
tulo. 

Determine la ecuación de regresión múltiple. ¿Cuáles son las variables independientes? 
¿Cuál es la variable dependiente? Analice los coeficientes de regresión. ¿Qué indica si algu- 
nos coeficientes son positivos y otros negativos? ¿Cuál es el valor de la intersección? ¿Cuál 
es el costo de calefacción estimado de una casa si la temperatura externa media es de 30 gra- 
dos, si el ático tiene 5 pulgadas de aislamiento y el calentador tiene 10 años? 


Inicie el análisis definiendo la variable dependiente y las independientes. La variable depen- 
diente es el costo de calefacción en enero, y se representa con Y. Hay tres variables indepen- 
dientes: 

La temperatura externa media en enero, representada por X-,. 

El número de pulgadas de aislamiento del ático, representado por X 2 . 

La antigüedad en años del calentador, representada por X 3 . 

Con estas definiciones, la forma general de la ecuación de regresión múltiple es la siguiente. 
El valor Y se emplea para estimar el valor de Y. 

Y — a + b-\X - 1 + ¿> 2 X 2 + ¿> 3 X 3 

Ahora que definió la ecuación de regresión, calcule con Excel o Minitab todas las estadísticas 
necesarias para el análisis. Las capturas de pantalla de ambos sistemas de software se mues- 
tran a continuación. 

Para predecir el costo de calefacción en enero con la ecuación de regresión es necesario 
conocer los valores de los coeficientes de regresión, b¡. Estos coeficientes están resaltados en 
los reportes del software. Observe que en el software se emplearon los nombres de variables 
o identificadores asociados con cada variable independiente. La intersección de la ecuación 
de regresión, a, se identifica como “constante” en la captura de pantalla de Minitab, y como 
“intersección” en la captura de pantalla en Excel. 
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En este caso, la ecuación de regresión estimada es: 

Y= 427.194 - 4.583X! - 14.831X 2 + 6.101X 3 

Ahora puede estimar o predecir el costo de calefacción en enero de una casa si conoce la 
temperatura externa media, las pulgadas de aislamiento y la antigüedad del calentador. Por 
ejemplo, para una casa con temperatura externa media por mes de 30 grados (X-,), hay 5 pul- 
gadas de aislamiento en el ático (X 2 ) y el calentador tiene 10 años (X 3 ). Al sustituir los valores 
de las variables independientes: 

Y= 427.194 - 4.583(30) - 14.831(5) + 6.101(10) = 276.56 
El costo estimado de calefacción en enero es de $276.56. 
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Los coeficientes de regresión y sus signos algebraicos también proporcionan información 
acerca de sus relaciones individuales con el costo de calefacción en enero. El coeficiente de 
regresión de una temperatura externa media es -4.583. El coeficiente es negativo y presenta 
una relación inversa entre el costo de calefacción y la temperatura. Eso no es sorprendente. 
Conforme la temperatura externa aumenta, disminuye el costo para calentar la casa. El valor 
numérico del coeficiente de regresión proporciona más información. Si la temperatura aumen- 
ta 1 grado y las otras dos variables independientes se mantienen constantes, se estima una 
disminución de $4.583 en el costo de calefacción mensual. Por lo tanto, si la temperatura 
media en Boston es 25 grados y en Filadelfia de 35 grados, y todos los demás elementos son 
iguales (aislamiento y antigüedad del calentador), se espera que el costo de calefacción sea 
$45.83 menos en Filadelfia. 

La variable aislamiento del ático también presenta una relación inversa: mientras más ais- 
lamiento tenga el ático, menor será el costo de calefacción de la casa. Por lo tanto, es lógico 
el signo negativo de este coeficiente. Por cada pulgada adicional de aislamiento, se espera que 
el costo de calefacción de la casa disminuya $14.83 por mes, si se mantienen constantes la 
temperatura externa y la antigüedad del calentador. 

La variable antigüedad del calentador presenta una relación directa. Con un calentador 
antiguo, aumenta el costo para calentar la casa. Específicamente, por cada año adicional que 
tenga el calentador, se espera que el costo aumente $6.10 por mes. 



En el noreste de Carolina del Sur hay muchos restaurantes que dan servicio a ias personas que 
toman sus vacaciones en la playa en el verano, a golfistas en el otoño y primavera, y a esquiadores 
en el invierno. Bill y Joyce Tuneall administran varios restaurantes en el área del norte de Jersey y 
consideran cambiarse a Myrtle Beach, Carolina del Sur, para abrir uno nuevo. Antes de tomar la 
decisión final desean estudiar algunos restaurantes existentes y las variables que parezcan relacio- 
narse con la rentabilidad. Reúnen información muestral donde las ganancias (reportadas en miles 
de dólares) es la variable dependiente, y las variables independientes son: 


X-¡ el número de cajones de estacionamiento cerca del restaurante. 

X 2 el número de horas que está abierto el restaurante por semana. 

X 3 la distancia desde el Peaches Córner (un monumento en el área central) en Myrtle Beach. 
X 4 el número de empleados. 

X 5 el número de años que el propietario actual ha tenido el restaurante. 


La siguiente es parte de la captura de pantalla que se obtuvo con software estadístico. 


Factor de 


SE 


predicción 

Constante 

Constante 

T 

Constante 

2.50 

1.50 

1.667 

Xl 

3 . 00 

1 . 500 

2 . 000 

*2 

4 . 00 

3 . 000 

1.333 

*3 

-3.00 

0.20 

-15.00 

x 4 

0.20 

.05 

4 . 00 

*5 

1.00 

1 . 50 

0 . 667 


a) ¿Cuál es la ganancia de un restaurante con 40 cajones de estacionamiento, que abre 72 horas a 
la semana, se encuentra a 10 millas del Peaches Córner, tiene 20 empleados y ha estado en ser- 
vicio durante 5 años? 

b) Interprete los valores de b 2 y b 3 en la ecuación de regresión múltiple. 


comed 


Ejercicios 

1. El director de marketing de Reeves Wholesale Products está estudiando las ventas mensuales. 
Para tal efecto, seleccionó tres variables independientes para estimar las ventas: población regio- 
nal, ingreso per cápita y la tasa de desempleo regional. La ecuación de regresión se calculó (en 
dólares): 

Y = 64 100 + 0.394X 1 + 9.6X 2 - 11 600X 3 
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a) ¿Cuál es el nombre completo de la ecuación? 

b) Interprete el número 64 100. 

c) ¿Cuáles son las ventas mensuales estimadas en una región particular con una población de 
796 000, un ingreso per cápita de $6 940 y una tasa de desempleo de 6.0%? 

2 . Thompson Photo Works compró varias máquinas nuevas de procesamiento muy complejas. El 
departamento de producción necesitó ayuda respecto de las aptitudes necesarias para un opera- 
dor de estas máquinas. ¿La edad es un factor? ¿Es importante el tiempo de servicio como opera- 
dor (en años)? A fin de explorar más a fondo los factores necesarios para estimar el desempeño 
de las nuevas máquinas de procesamiento, se señalaron cuatro variables: 

X-, = Tiempo del empleado en la industria. 

X 2 = Calificación en la prueba de aptitud mecánica. 

X 3 = Calificaciones anteriores en el trabajo. 

X 4 = Edad. 


El desempeño de la máquina nueva se designa Y. 

Se seleccionaron 30 empleados al azar. Se recopilaron datos de cada uno, y se registraron sus 
desempeños en las máquinas nuevas. Algunos resultados son: 



Desempeño 
en la máquina 
nueva, 

Tiempo 
en la 
industria, 

Calificación 
en aptitud 
mecánica, 

Desempeño 
anterior 
en el trabajo, 

Edad, 

Nombre 

Y 


X 2 

*3 

*4 

Mike Miraglia 

112 

12 

312 

121 

52 

Sue Trythall 

113 

2 

380 

123 

27 


La ecuación es: 


Y= 11.6 + 0.4X, + 0.286X 2 + 0.112X 3 + 0.002X 4 

a) ¿Cómo se le denomina a esta ecuación? 

b ) ¿Cuántas variables dependientes hay?, ¿cuántas independientes? 

c) ¿Cómo se denomina al número 0.286? 

d ) Conforme aumenta la edad en un año, ¿cuánto aumenta el desempeño estimado en la nueva 
máquina? 

e) Cari Knox solicitó trabajo en Photo Works. Konx ha estado en el negocio durante seis años, y 
obtuvo una calificación de 280 en la prueba de aptitud mecánica. La calificación del desem- 
peño anterior en el trabajo de Cari fue 97, y tiene 35 años de edad. Estime su desempeño en 
la nueva máquina. 

3 . Se estudió una muestra de empleados de General Mills para determinar el grado de satisfacción 
con su vida actual. Se empleó un índice especial, denominado índice de satisfacción. Se estudia- 
ron seis factores, a saber, la edad en la que se casaron por primera vez (X-,), el ingreso anual (X 2 ), 
el número de hijos vivos (X 3 ), el valor de todos sus bienes (X 4 ), el estado de salud en forma de índi- 
ce (X 5 ) y el número promedio de actividades sociales por semana, como jugar al boliche y bailar 
(X 6 ). Suponga que la ecuación de regresión múltiple es: 

Y= 16.24 + 0.017X! + 0.0028X 2 + 42X 3 + 0.0012X 4 + 0.19X 5 + 26.8X 6 

a) ¿Cuál es índice de satisfacción estimado de una persona que se casó por primera vez a los 18 
años, con un ingreso anual de $26 500, tres hijos vivos, bienes por $156 000, un índice de es- 
tado de salud de 141, y tiene 2.5 actividades sociales a la semana en promedio? 

b) ¿Qué daría más satisfacción: un ingreso adicional de $10 000 al año o dos actividades socia- 
les más a la semana? 

4 . Cellulon, fabricante de aislamiento para casas, desea desarrollar guías para informar a construc- 
tores y consumidores sobre la forma en que el espesor del aislamiento del ático de una casa y la 
temperatura externa afectan el consumo de gas natural. En el laboratorio modificó el espesor del 
aislamiento y la temperatura. Algunos resultados son: 
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0A2 Elaborar, interpretar y 
aplicar una tabla ANOVA. 


Consumo de gas 
natural mensual 
(pies cúbicos), 

Y 

Espesor del 
aislamiento 
( pulgadas), 

Temperatura 

externa 

(°F), 

X 2 

30.3 

6 

40 

26.9 

12 

40 

22.1 

8 

49 


Con base en los resultados muéstrales, la ecuación de regresión es: 

/= 62.65 - 1.86X, - 0.52X 2 

a) ¿Qué cantidad de gas natural esperan consumir por mes los propietarios de las casas si ins- 
talan 6 pulgadas de aislamiento y la temperatura exterior es de 40 °F? 

b) ¿Qué efecto tendría instalar 7 pulgadas de aislamiento en lugar de 6 en el consumo mensual 
de gas natural (si la temperatura externa permanece en 40 °F)? 

c) ¿Por qué son negativos los coeficientes de regresión ó-, y b 2 ? ¿Es lógico que lo sean? 

14.3 Evaluación de una ecuación 
de regresión múltiple 

Muchas estadísticas y métodos estadísticos se utilizan para evaluar la relación entre una varia- 
ble dependiente y más de una variable independiente. El primer paso fue expresar la relación 
en términos de una ecuación de regresión múltiple. El siguiente paso sigue los conceptos que 
se presentaron en el capítulo 13, utilizando la información en una tabla ANOVA para evaluar 
con qué nivel de precisión se ajusta la ecuación a los datos. 


La tabla ANOVA 


Como se hizo en el capítulo 13, el análisis estadístico de una ecuación de regresión múltiple 
se resume en una tabla ANOVA. Recordemos que la variación total de una variable dependien- 
te, Y, se divide en dos componentes: 1) regresión, o la variación de Y explicada por todas las 
variables independientes, y 2) el error o residuo, o variación no explicada de Y. Estas dos cate- 
gorías se Identifican en la primera columna de la siguiente tabla ANOVA. La columna con el 
encabezado “gl" se refiere a los grados de libertad asociados con cada categoría. El número 
total de grados de libertad es n — 1. El número de grados de libertad en la regresión es igual 
al número de variables independientes existente en la ecuación de regresión múltiple. 
Denominamos k a los grados de libertad de la regresión. El número de grados de libertad aso- 
ciados con el término error es igual al total de grados de libertad menos los grados de liber- 
tad de la regresión. En una regresión múltiple, los grados de libertad son n - (k + 1). 


Fuente 


gi 

SS 


MS 

F 

Regresión 

k 


SSR 

MSR 

= SSR//C 

MSR/MSE 

Residuo o error 

n - 

(*+ 1) 

SSE 

MSE 

= SSE/[n - (k + 1)] 


Total 

n - 

i 

SS total 





El término “SS”, localizado a la mitad de la tabla ANOVA, se refiere a la suma de los cua- 
drados. Observe que existe una suma de cuadrados en cada fuente de variación. La columna 
de la suma de los cuadrados muestra la cantidad de variación atribuible a cada fuente. La 
variación total de la variable independiente, Y, está resumido en SS total. Debe notar que este 
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OA3 Calcular e interpretar 
medidas de asociación de la 
regresión múltiple. 


resultado es simplemente el numerador de la fórmula usual para calcular cualquier variación; 
en otras palabras, la suma de las desviaciones al cuadrado de la media. Se calcula como: 

Suma de cuadrados total = SS total = 2(Y - Y) 2 

Como hemos visto, la suma de cuadrados total es la suma de la suma de los cuadrados de la 
regresión y del residuo. La suma de los cuadrados de la regresión es la suma de las diferen- 
cias al cuadrado entre los valores estimados o pronosticados, Y, y la media general de Y. La 
suma de los cuadrados de la regresión se calcula así: 

Suma de los cuadrados de la regresión = SSR = 2(Y - Y) 2 

La suma de los cuadrados del residuo es la suma de las diferencias al cuadrado entre los valo- 
res observados de la variable dependiente Y, y sus valores estimados o pronosticados corres- 
pondientes, Y. Observe que esta diferencia es el error de estimar o predecir la variable 
independiente con la ecuación de regresión múltiple. Se calcula: 

Suma de los cuadrados del error o residuo = SSE = 2(Y - Y) 2 

Utilizaremos la información de la tabla ANOVA del ejemplo previo para evaluar la ecuación 
de regresión para estimar los costos de calefacción en enero. 
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Error estándar de estimación múltiple 

Comenzamos con el error estándar de estimación múltiple. Recuerde que el error estándar 
de estimación es comparable con la desviación estándar. Para explicar los detalles del error 
estándar de estimación, consulte la primera casa muestreada en la tabla 14-1 del ejemplo 
anterior en la página 51 5. El costo de calefacción actual de la primera observación, Y, es $250, 
la temperatura externa, Xi, es 35 grados, el espesor del aislamiento X 2 , es 3 pulgadas, y la 
antigüedad del calentador, X 3 , es 6 años. Mediante la ecuación de regresión que se desarro- 
lló en la sección anterior, el costo de calefacción estimado de esta casa es: 

Y = 427.194 - 4.583X 1 - 14.831X 2 + 6.101X 3 

= 427.194 - 4.583(35) - 14.831(3) + 6.101(6) 

= 258.90 

Por lo tanto, se estimaría que la calefacción de una casa con una temperatura externa media 
en enero de 35 grados, 3 pulgadas de aislamiento y un calentador de 6 años de antigüedad 
costaría $258.90. El costo de calefacción actual fue $250, por lo cual el residuo, que es la dife- 
rencia entre el valor actual y el valor estimado, es Y - Y = 250 — 258.90 = -8.90. Esta dife- 
rencia de $8.90 es el error aleatorio o no explicado del primer elemento muestreado. El 
siguiente paso es elevar al cuadrado esta diferencia, es decir; determinar (Y - V) 2 = (250 - 
258.90) 2 = (-8.90) 2 = 79.21. 


14.3 Evaluación de una ecuación de regresión múltiple 


521 


Estas operaciones se repiten con las otras 1 9 observaciones y se suman todas las 20 dife- 
rencias al cuadrado; el total será la suma de los cuadrados del error o residuo de la tabla 
ANOVA. Utilizando esta información, podemos calcular el error estándar de estimación múlti- 
ple como: 


ERROR ESTÁNDAR DE 
ESTIMACIÓN MÚLTIPLE 


2 (Y - Y) 2 
n - (k+ 1) 


> 


SSR 


n - (k + 1) 


(14-2) 




donde: 

Y es la observación actual. 

Y es el valor estimado calculado mediante la ecuación de regresión. 

n es el número de observaciones en la muestra. 

k es el número de variables independientes. 

SSR es la suma de los cuadrados del residuo de la tabla ANOVA. 

Todavía hay más información en la tabla ANOVA que se puede usar para calcular el error 
estándar de estimación múltiple. Note que la siguiente columna en ella está etiquetada como 
MS, siglas en inglés de media al cuadrado. En el caso de las fuentes de variación de la regre- 
sión y del residuo, las medias cuadradas se calculan como la suma de los cuadrados dividi- 
dos por sus correspondientes grados de libertad. En el caso del error estándar de estimación 
múltiple de la media, el error estándar de estimación múltiple es la raíz cuadrada de la media 
cuadrada residual. 

S y . 123 ... K = VMSE = V2605.995 = $51.05 

¿Cómo interpretar el error estándar de estimación de 51 .05? Es el “error” típico cuando 
se emplea esta ecuación para predecir el costo. Primero, las unidades son las mismas que en 
la variable dependiente, por lo cual el error estándar es en dólares ($51 .05). Segundo, se espe- 
ra que los residuos sean aproximados a una distribución más o menos normal, por lo que alre- 
dedor de 68% de ellos estará dentro de ±$51.05 y cerca de 95% dentro de ±2(51.05) = 
±$1 02.1 0. Como ocurrió con similares medidas de dispersión, como el error estándar de esti- 
mación del capítulo 13, un error estándar múltiple indica una mejor ecuación de predicción o 
más eficiente. 

Coeficiente de determinación múltiple 

En seguida, se considera el coeficiente de determinación múltiple. Recuerde, del capítulo 
anterior, que el coeficiente de determinación se define como el porcentaje de la variación de 
la variable dependiente explicada, o contabilizada, por la variable independiente. En el caso 
de la regresión múltiple se amplía esta definición, como sigue. 


COEFICIENTE DE DETERMINACIÓN MÚLTIPLE Es el porcentaje de variación de la variable depen- 
diente, Y, explicada por el conjunto de variables independientes, X 2 , X 3 , ..., X k . 


Las características del coeficiente de determinación múltiple son: 

1 . Se representa por una letra R mayúscula al cuadrado. En otras palabras, se escribe 
como R 2 debido a que se comporta como el cuadrado de un coeficiente de correlación. 

2. Puede variar de 0 a 1 . Un valor cercano a 0 indica poca asociación entre el conjunto de 
variables independientes y la variable dependiente. Un valor cercano a 1 significa una aso- 
ciación fuerte. 

3. No puede adoptar valores negativos. Ningún número que se eleve al cuadrado o se 
eleve a la segunda potencia puede ser negativo. 

4. Es fácil de interpretar. Como R 2 es un valor entre 0 y 1 es fácil de interpretar, comparar 
y comprender. 
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Podemos calcular el coeficiente de determinación a partir de la información de la tabla ANOVA. 
Observe la columna de la suma de los cuadrados, etiquetada con SS en la captura de panta- 
lla de Excel, y utilice la suma de los cuadrados de la regresión, SSR, y divídala entre la suma 
total de los cuadrados, SS total. 


COEFICIENTE DE DETERMINACIÓN MÚLTIPLE 


SSR 
SS total 


(14-3) 


Usando los residuos y la suma total de los cuadrados de la tabla ANOVA, se puede em- 
plear la fórmula (14-3) para calcular el coeficiente de determinación múltiple. 


R 2 


SSR 
SS total 


171 220 
212 916 


.804 


¿Cómo se interpreta este valor? Las variables independientes (temperatura externa, cantidad 
de aislamiento y antigüedad del calentador) explican, o contabilizan, 80.4% de la variación del 
costo de calefacción. En otras palabras, 19.6% de la variación se debe a otras fuentes, como 
el error aleatorio o variables no incluidas en el análisis. Mediante la tabla ANOVA, 19.6% 
corresponde a la suma de los errores al cuadrado dividida entre la suma total de los cuadra- 
dos. SI SSR + SSE = SS total, la relación siguiente es válida. 


1 - R 2 = 1 - 


SSR 
SS total 


SSE 
SS total 


41 695 
212 916 


.196 


Coeficiente ajustado de determinación 

El número de variables independientes de una ecuación de regresión múltiple aumenta el coe- 
ficiente de determinación. Cada nueva variable Independiente hace que las predicciones sean 
más precisas, lo que a su vez reduce el SSE y aumenta el SSR. De aquí, R 2 aumenta sólo debi- 
do al número total de variables independientes y no porque la variable Independiente agrega- 
da sea un buen factor de predicción de la variable dependiente. De hecho, si el número de 
variables, k, y el tamaño de la muestra, n, son ¡guales, el coeficiente de determinación es 1 .0. 
En la práctica, esta situación es poco frecuente y también sería éticamente cuestionable. Para 
equilibrar el efecto del número de variables Independientes en el coeficiente de determinación 
múltiple, los paquetes de software estadísticos emplean un coeficiente de determinación ajus- 
tado múltiple. 


SSE 

COEFICIENTE DE DETERMINACIÓN AJUSTADO fí| dj = 1 - ” 33 ^^ (14-4) 

n - 1 


Las sumas totales de los cuadrados y del error se dividen entre sus grados de libertad. Obser- 
ve en especial que los grados de libertad para la suma de los errores al cuadrado incluyen k, 
el número de variables Independientes. En el ejemplo del costo de calefacción, el coeficiente 
de determinación ajustado es: 


41 695 


fí 2 adj = 1 - 


20 - (3 + 1) 
212 916 
20 - 1 


= 1 - 


2 606 
11 206.0 


= 1 - .23 = .77 


Si se compara R 2 (0.80) con R 2 ajustada (0.77), la diferencia en este caso es pequeña. 
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Consulte la autoevaluación 14-1 respecto de los restaurantes en Myrtle Beach. La parte de la tabla 
ANOVA de la captura de pantalla de la regresión es la siguiente. 


A 


Análisis de regresión 


Fuente 

DF 

SS 

MS 

Regresión 

5 

100 

20 

Error residual 

20 

40 

2 

Total 

25 

140 



a) ¿Cuál fue el tamaño de la muestra? 

b) ¿Cuántas variables independientes hay? 

c) ¿Cuántas variables dependientes hay? 

d) Calcule el error estándar de estimación. ¿Entre qué valores estará aproximadamente 95% de los 
residuos? 

e) Determine el coeficiente de determinación múltiple. Interprete este valor. 

f) Encuentre el coeficiente de determinación múltiple, ajustado según los grados de libertad. 


comed 


Ejercicios 

5. Considere la siguiente tabla ANOVA. 


Análisis de la 

varianza 





Fuente 

DF 

SS 

MS 

F 

P 

Regresión 

2 

77 . 907 

38 . 954 

4 . 14 

0.021 

Error residual 

62 

583.693 

9.414 



Total 

64 

661.600 





a) Determine el error estándar de estimación. ¿Entre qué valores estará cerca de 95% de los resi- 
duos? 

b) Determine el coeficiente de determinación múltiple. Interprete este valor. 

c) Determine el coeficiente de determinación múltiple, ajustado según los grados de libertad. 

6. Considere la siguiente tabla ANOVA. 


Análisis de la 
Fuente 
Regresión 
Error residual 
Total 


vananza 

DF SS 

5 3710.00 

46 2647.38 

51 6357.38 


MS F 

742.00 12.89 

57 . 55 


a) Determine el error estándar de estimación. ¿Entre qué valores estará aproximadamente 95% 
de los residuos? 

b) Determine el coeficiente de determinación múltiple. Interprete este valor. 

c) Determine el coeficiente de determinación múltiple, ajustado por los grados de libertad. 


14.4 Inferencias en la regresión lineal múltiple 

Hasta este punto, el análisis de regresión múltiple se consideró sólo como una forma para des- 
cribir la relación entre una variable dependiente y varias variables independientes. Sin embar- 
go, el método de mínimos cuadrados también permite inferir o generalizar a partir de la 
relación de una población completa. Recuerde que cuando se crearon intervalos de confian- 
za o cuando se realizaron pruebas de hipótesis como parte de la estadística inferencial, los 
datos se consideraron una muestra aleatoria tomada de una población. 

En el escenario de la regresión múltiple, se supone que hay una ecuación desconocida de 
regresión múltiple de la población que relaciona la variable dependiente con las k variables 
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OA4 Realizar una prueba de 
hipótesis para determinar si 
los coeficientes de regresión 
difieren de cero. 


independientes. Algunas veces a esto se le denomina modelo de la relación. En símbolos se 
escribe: 

/ = a + + p 2 X 2 + ■ ■ ■ + $ k X k 

Esta ecuación es análoga a la fórmula (14-1), excepto que ahora los coeficientes se denotan 
con letras griegas. Con las letras griegas se denotan parámetros poblacionales. Así, con cier- 
to conjunto de suposiciones, las cuales se analizarán en breve, los valores calculados de a y 
bj son estadísticos muéstrales. Estos estadísticos muéstrales son estimadores puntuales de 
los parámetros poblacionales correspondientes a y p y . Por ejemplo, el coeficiente de regresión 
de la muestra b 2 es un estimador puntual del parámetro poblaclonal (3 2 . La distribución mues- 
tral de estos estimadores puntuales sigue la distribución de probabilidad normal. Estas distri- 
buciones muéstrales se centran en sus valores de los parámetros respectivos. En otras 
palabras, las medias de las distribuciones muéstrales son iguales a los valores de los paráme- 
tros que se estimarán. Así, con las propiedades de las distribuciones muéstrales de estos esta- 
dísticos, es posible inferir acerca de los parámetros poblacionales. 


Prueba global: prueba del modelo de regresión múltiple 

Es posible demostrar la capacidad de las variables independientes X-¡, X 2 ,..., X k para explicar 
el comportamiento de la variable dependiente Y. Para expresarlo en forma de pregunta: ¿Es 
posible estimar la variable dependiente sin basarse en las variables Independientes? A esta 
prueba se le denomina prueba global. Básicamente, mediante esta prueba se investiga si es 
posible que todas las variables independientes tengan coeficientes de regresión cero. 

Para relacionar esta pregunta con el ejemplo del costo de calefacción, se comprobará si 
las variables independientes (cantidad de aislamiento del ático, temperatura externa diaria 
media y antigüedad del calentador) sirven para calcular el costo de calefacción de la casa. 
Para probar una hipótesis, primero se formulan las hipótesis nula y alternativa. En el ejemplo 
del costo de calefacción, hay tres variables independientes. Recuerde que b A ,b 2 y b 3 son coe- 
ficientes de regresión de la muestra. A los coeficientes correspondientes en la población se les 
asignan los símbolos (3 1 , (3 2 y (3 3 . Ahora se comprueba si todos los coeficientes de regresión 
en la población son cero. La hipótesis nula es: 

Hq. Pi = P2 = P3 = 0 

La hipótesis alternativa es: 

H{. No todas las (3, son 0. 

Si la hipótesis nula es verdadera, eso implica que todos los coeficientes de regresión son cero 
y, por lógica, no son útiles para estimar la variable dependiente (costo de calefacción). De ser 
así, habría que buscar algunas otras variables Independientes, o tomar una aproximación dis- 
tinta, para predecir el costo de calefacción de la casa. 

Para probar la hipótesis nula de que todos los coeficientes de regresión múltiple son cero, 
se emplea la distribución F presentada en el capítulo 12. Use un nivel de significancia 0.05. 
Recuerde estas características de la distribución F: 

1. Existe una familia de distribuciones F. Cada vez que los grados de libertad en el 
numerador o en el denominador cambian, se crea una nueva distribución F. 

2. La distribución F no puede ser negativa. El menor valor posible es 0. 

3. Es una distribución continua. La distribución puede tomar un número Infinito de valo- 
res entre 0 y el Infinito positivo. 

4. Es sesgada de manera positiva. La cola de la distribución se encuentra a la derecha. 
Conforme el número de grados de libertad aumenta, tanto en el numerador como en el 
denominador, la distribución se aproxima a la distribución de probabilidad normal. Es 
decir, la distribución se moverá hacia una distribución simétrica. 

5. Es asintótica. Conforme aumentan los valores de X, la curva F se aproximará al eje 
horizontal, pero nunca lo tocará. 

A continuación se recurre al estadístico F para probar la hipótesis global. Como en el capí- 
tulo 12, es el rango de dos varianzas. En este caso, el numerador es la suma de los cuadra- 
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dos de la regresión dividida entre sus grados de libertad, k. El denominador es la suma de los 
cuadrados del error dividida entre sus grados de libertad, n — (k + 1). La fórmula es: 


/ 

PRUEBA GLOBAL 

V 


SSR//C 

SSE/[n - (k + 1)] 


(14-5) 


A partir de la tabla ANOVA, el estadístico F es: 


SSR/k 

SSE /[n ~(k+ 1)] 


MSR 

MSE 


21.90 


Recuerde que el estadístico F prueba la hipótesis nula básica de que dos varlanzas o, en 
este caso, dos medias cuadradas, son ¡guales. Recuerde también que siempre ponemos a la 
mayor de las varianzas en el numerador. En nuestra prueba de hipótesis global de regresión 
múltiple, rechazaremos la hipótesis nula, H 0 , de que todos los coeficientes de regresión son 
cero cuando la media cuadrada de la regresión es mayor en comparación con la media cua- 
drada del residuo. Si esto es cierto, el estadístico F será relativamente grande, y estará en la 
cola de la extrema derecha de la distribución F; el valor p será pequeño, esto es, menor que 
nuestra elección de nivel de significancia de 0.05. Por ello, rechazaremos la hipótesis nula. 

Como con otros métodos de prueba de hipótesis, la regla de decisión puede basarse en 
cualquiera de dos procedimientos: 1) comparar el estadístico de prueba con un valor crítico, 
o 2) calcular un valor p basado en el estadístico de prueba y comparando el valor p con el nivel 
de significancia. Utilizando el método del valor crítico, se calcula primero el valor crítico de F 
que requiere tres piezas de Información: 1) el numerador grados de libertad, 2) el denomina- 
dor grados de libertad, y 3) el nivel de significancia. Los grados de libertad para el numerador 
y el denominador se determinan en la siguiente tabla ANOVA en Excel. La captura de pantalla 
de la tabla ANOVA se resalta en color verde. El número superior en la columna identificada “gl” 
es 3, para indicar que hay tres grados de libertad en el numerador. Este valor corresponde 
al número de variables independientes. El número a la mitad de la columna “gl” (16) indica 
que hay 16 grados de libertad en el denominador. El número 16 se determina por medio de 
n - (k - 1) = 20 - (3 - 1) = 16. 
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El valor crítico de F se encuentra en el apéndice B.4. Utilice la tabla con el nivel de signi- 
ficancia 0.05, al moverse por renglones a 3 grados de libertad en el numerador, y luego hacia 
abajo a 16 grados de libertad en el denominador se lee el valor crítico. Éste es 3.24. Las regio- 
nes de rechazo y aceptación de H 0 se muestran en el siguiente diagrama. 



526 


CAPÍTULO 14 Análisis de correlación y regresión múltiple 


OA5 Realizar una prueba de 
hipótesis en cada uno de los 
coeficientes de regresión. 


Distribución F 



Al aplicar la prueba global, la regla de decisión es: no rechace la hipótesis nula de que 
todos los coeficientes de regresión son 0 si el valor calculado de F es menor que o igual 
que 3.24. Si el valor calculado de F es mayor que 3.24, se rechaza H 0 y se acepta la hipótesis 
alternativa, /-/ . 

El valor calculado de F es 21 .90, que se encuentra en la reglón de rechazo. Por lo tanto, 
se descarta la hipótesis nula de que todos los coeficientes de regresión múltiple son cero. Esto 
significa que algunas variables independientes (cantidad de aislamiento, etc.) tienen la capa- 
cidad de explicar la variación de la variable dependiente (costo de calefacción). Se esperaba 
esta decisión. Es lógico que la temperatura externa, la cantidad de aislamiento y la antigüe- 
dad del calentador tengan un gran peso sobre el costo de calefacción. La prueba global lo 
demuestra. 

La prueba de la hipótesis nula también puede basarse en un valor p, que se reporta en la 
captura de pantalla de todas las pruebas de hipótesis. En el caso del estadístico F, el valor p 
se define como la probabilidad de observar un valor F tan o más grande que el estadístico de 
prueba F, asumiendo que la hipótesis nula es verdadera. Si el valor p es menor que el nivel 
de significancia elegido, se decide rechazar la hipótesis nula. La tabla ANOVA muestra que el 
valor p del estadístico F es igual a 0.000. Es claramente menor que el nivel de significancia de 
0.05. Por lo tanto, se decide rechazar la hipótesis global nula y se concluye que cuando menos 
uno de los coeficientes de regresión no es igual a cero. 

La decisión es la misma que cuando se utilizó el método del valor crítico. La ventaja de 
usar el procedimiento del valor p es que éste nos da la “esencia” de la decisión. El valor p cal- 
culado es mucho menor que nuestro nivel de significancia (.000 versus .05). Rechazamos la 
hipótesis nula de que todos los coeficientes de regresión son 0 y, con base en el valor p, con- 
cluimos que hay pocas probabilidades de que esta hipótesis sea verdadera. 


Evaluación de los coeficientes de regresión individuales 

Hasta este punto, al menos uno, no necesariamente todos, los coeficientes de regresión no 
son ¡guales a cero, y por ende son útiles para realizar predicciones. El siguiente paso es pro- 
bar las variables independientes de manera individual para determinar qué coeficientes de 
regresión pueden ser 0 y cuáles no. 

¿Por qué es importante saber si algunas de las p y son ¡guales a 0? Si una (3, puede ser 
Igual a 0, implica que esta variable independiente en particular no tiene valor para explicar 
alguna variación del valor dependiente. Si hay coeficientes con respecto a los cuales H 0 no se 
puede rechazar, quizá sea prudente eliminarlos de la ecuación de regresión. 

Ahora se realizan tres pruebas de hipótesis separadas: para la temperatura, el aislamien- 
to y la antigüedad del calentador. 


Para la 
temperatura: 


Para el 
aislamiento: 


Para la antigüedad 
del calentador: 


H 0 - Pi — 0 


H 0 - P 2 — 0 

H-\\ p 2 A 0 


H 0 \ P3 — 0 

H-\- P3 ^ 0 
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Se probará la hipótesis con el nivel de significancia 0.05. Note que éstas son pruebas de dos 
colas. 

El estadístico de prueba sigue la distribución t de Student con n - (k + 1) grados de liber- 
tad. El número de observaciones muéstrales es n. Hay 20 casas en el estudio, por lo cual n = 
20. El número de variables independientes es k, el cual es 3. Así, hay n - (k + 1) = 20 — (3 + 
1) = 16 grados de libertad. 

El valor crítico de t se encuentra en el apéndice B.2. En el caso de una prueba de dos 
colas con 16 grados de libertad y el nivel de significancia 0.05, H 0 se rechaza si t es menor 
que -2.120 o mayor que 2.120. 

Consulte la captura de pantalla de Excel de la sección anterior. (Vea la página 525.) La 
columna resaltada en color amarillo, con encabezado “Coefficients”, muestra los valores de la 
ecuación de regresión múltiple: 

Y= 427.194 - 4.583X-, - 14.831X 2 + 6.101X 3 

Al interpretar el término — 4.583X! en la ecuación, por cada grado de aumento de temperatu- 
ra, se espera que el costo de calefacción disminuya aproximadamente $4.58, si las otras dos 
variables permanecen constantes. 

La columna en la captura de pantalla de Excel identificada como “Standard Error” indica el 
error estándar del coeficiente de regresión de la muestra. Recuerde que Salsberry Realty selec- 
cionó una muestra de 20 casas a lo largo de la costa este de Estados Unidos. Si la empresa 
fuera a seleccionar una segunda muestra aleatoria y a calcular los coeficientes de regresión de 
esa muestra, los valores no serían exactamente los mismos. Sin embargo, si se repitiera el pro- 
ceso de muestreo muchas veces se podría diseñar una distribución de muestreo de estos coe- 
ficientes de regresión. La columna “Standard Error” estima la variabilidad de estos coeficientes 
de regresión. La distribución de muestreo de los coeficientes sigue la distribución t con n - (k 
+ 1) grados de libertad. De aquí, se pueden probar las variables independientes individualmen- 
te para determinar si los coeficientes de regresión difieren de cero. La fórmula es: 


PRUEBA DE LOS COEFICIENTES 
DE REGRESIÓN INDIVIDUALES 


b¡ - 0 

S b, 


(14-6) 


y 


El coeficiente b¡ se refiere a cualquiera de los coeficientes de regresión, y s b , a la desvia- 
ción estándar de esa distribución del coeficiente de regresión. Se incluye 0 en la ecuación 
debido a que la hipótesis nula es p, = 0. 

Para ¡lustrar esta fórmula, consulte la prueba del coeficiente de regresión para la variable 
independiente, temperatura. Según la captura de pantalla de la página 525, el coeficiente de 
regresión para la temperatura es -4.583. La desviación estándar de la distribución muestral 
del coeficiente de regresión de la variable independiente temperatura es 0.772. Al sustituir 
estos valores en la fórmula (14-6): 


ó, - 0 _ -4.583 - 0 
s bl " 0.772 


-5.937 


Aplicando la fórmula, el rango t calculado es -5.937 de temperatura (la pequeña diferencia 
entre el valor calculado y el que se muestra en la captura de pantalla de Excel se debe al 
redondeo) y -3.119 del aislamiento. Estos dos valores t están en la reglón de rechazo a la 
izquierda de -2.120. Por ello, concluimos que los coeficientes de regresión de las variables 
temperatura y aislamiento no son cero. El valor t calculado en el caso de la edad del calenta- 
dor es 1.521, así que se concluye que podría Igualar a 0. La variable independiente edad del 
calentador no es un factor de predicción significativo del costo de la calefacción. Puede ser 
retirada del análisis. 

También se pueden utilizar valores p para probar los coeficientes de regresión individual. 
De nuevo, éstos suelen ser reportados en una captura de pantalla. El rango t calculado de tem- 
peratura en la pantalla de Excel es —5.934 y tiene un valor p de 0.000. Como el valor p es 
menor a 0.05, el coeficiente de regresión de la variable independiente temperatura no es igual 
a cero, y debe ser incluido en la ecuación para pronosticar los costos de calefacción. En el 
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caso del aislamiento, el rango f es -3.1 1 9 y tiene un valor p de 0.007. Como en el caso de la 
temperatura, el valor p es menor a 0.05, así que se concluye que el coeficiente de regresión 
del aislamiento no es igual a cero y debe ser incluido en la ecuación para pronosticar el costo 
de calefacción. En contraste a estas dos variables, el valor p para probar el coeficiente de 
regresión de la “antigüedad del calefactor” es 0.148. Claramente es mayor que 0.05, por lo que 
podemos concluir que el coeficiente de regresión de la “antigüedad del calefactor” podría 
igualar a 0. Además, como variable Independiente no es un factor de predicción significativo 
del costo de calefacción. De esta forma, la antigüedad del calefactor no debe ser incluida en 
la ecuación para pronosticar los costos de calefacción. 

En este punto, es necesario elaborar una estrategia para eliminar variables independien- 
tes. En el caso de Salsberry Realty había tres variables Independientes, una de las cuales (la 
antigüedad del calentador) tenía un coeficiente de regresión que no fue distinto de 0. Es obvio 
que se debe omitir esa variable y volver a efectuar la ecuación de regresión. La siguiente es 
la captura de pantalla de Mlnitab, donde el costo de calefacción es la variable dependiente, 
y la temperatura externa y la cantidad de aislamiento, las variables independientes. 



A continuación se resumen los resultados de esta nueva captura de pantalla de Minitab: 

1 . La nueva ecuación de regresión es: 

Y= 490.29 - 5.1499X-, - 14.718X 2 

Observe que los coeficientes de regresión de la temperatura externa (X-i) y la cantidad de 
aislamiento (X 2 ) son similares, pero no ¡guales, cuando se incluyó la variable independien- 
te, antigüedad del calentador. Compare la ecuación anterior con la de la captura de pan- 
talla de Excel de la página 525. Los dos coeficientes de regresión son negativos, como en 
la ecuación anterior. 

2. Los detalles de la prueba global son los siguientes: 

H 0 - Pl = p2 = 0 
Hp No todas las (3, = 0 

La distribución F es el estadístico de prueba, y hay k = 2 grados de libertad en el nume- 
rador y n — (k + 1) = 20 — (2 + 1) = 17 grados de libertad en el denominador. Con el nivel 
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de significancia de 0.05 y el apéndice B.4, la regla de decisión es rechazar H 0 si F es 
mayor que 3.59. El valor de F se calcula así: 


SSR/k _ 165 195/2 

SSE/[n - (k+ 1)] “ 47 721/[20 - (2 + 1)] 


29.42 


Como el valor calculado de F (29.42) es mayor que el valor crítico (3.59), se rechaza la 
hipótesis nula y se acepta la hipótesis alternativa. Se concluye que al menos uno de los 
coeficientes de regresión es diferente de 0. 

Utilizando el valor p, la prueba del estadístico F (29.42) tiene un valor p (0.000) que es 
claramente menor a 0.05. Por lo tanto, rechazamos la hipótesis nula y aceptamos la alter- 
nativa. Se concluye que cuando menos uno de los coeficientes de regresión es distinto 
a 0. 

3. El siguiente paso es realizar la prueba de los coeficientes de regresión de manera indivi- 
dual. Se desea saber si uno o ambos coeficientes de regresión son diferentes de 0. Las 
hipótesis nula y alternativa de cada una de las variables independientes son: 

Temperatura externa Aislamiento 

H 0 \ (3i = 0 H q \ p 2 = 0 

H{. A 0 F/i:p 2 #0 

El estadístico de prueba es la distribución t con n - {k + 1) = 20 — (2 + 1) = 17 grados 

de libertad. Con el nivel de significancia de 0.05 y el apéndice B.2, la regla de decisión es 
rechazar H 0 si el valor calculado de t es menor que —2.1 10 o mayor que 2.1 10. 


Temperatura externa 


Aislamiento 


£>! - 0 _ -5.1499 - 0 _ t> 2 -0 _-14.718-0 

s bi ~~ 0.7019 ~~ ' í_ s b2 4.934 


-2.98 


En las dos pruebas se rechaza Fl 0 y se acepta . Se concluye que cada uno de los coeficien- 
tes de regresión es diferente de 0. Tanto la temperatura externa como la cantidad de aisla- 
miento son variables útiles para explicar la variación del costo de calefacción. 

Utilizando los valores p, el valor p del estadístico t temperatura es 0.000, y el del aisla- 
miento es 0.008. Ambos valores p son menores a 0.05, así que en ambas pruebas se rechaza 
la hipótesis nula y se concluye que cada uno de los coeficientes de regresión es diferente a 0. 
Tanto la temperatura externa como la cantidad de aislamiento son variables útiles para expli- 
car la variación del costo de calefacción. 

En el ejemplo del costo de calefacción, fue claro qué variable independiente se debía eli- 
minar; en algunos casos no es tan claro qué variable se debe eliminar. Para explicar esto, 
suponga que se formula una ecuación de regresión múltiple con base en cinco variables inde- 
pendientes. Se realiza la prueba global y se determina que algunos de los coeficientes de 
regresión son diferentes de 0. Luego, se prueban los coeficientes de regresión de manera indi- 
vidual y se determina que tres son significativos y dos no. El procedimiento preferido es omi- 
tir la variable dependiente individual con el menor valor t absoluto o valor p mayor y volver a 
formular la ecuación de regresión con las cuatro variables restantes; después, en la nueva 
ecuación de regresión con cuatro variables independientes, se realizan las pruebas individua- 
les. Si aún hay coeficientes de regresión que no son significativos, de nuevo se omite la varia- 
ble con el menor valor t absoluto. Para describir el proceso de otra manera, se debe eliminar 
una variable a la vez. Cada vez que se elimina una variable, es necesario volver a formular la 
ecuación de regresión y verificar las variables restantes. 

Este proceso de seleccionar variables para incluirlas en un modelo de regresión se auto- 
matiza con Excel, Minitab, MegaStat u otro software estadístico. La mayoría de los sistemas 
de software incluye métodos para eliminar en secuencia y/o agregar variables independientes 
y al mismo tiempo proporcionar estimaciones del porcentaje de la variación explicada (el tér- 
mino R cuadrada). Dos de los métodos más comunes son la regresión por pasos y la regre- 
sión del mejor subconjunto. Consumen mucho tiempo, pero es posible calcular cada una de 
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las regresiones entre la variable dependiente y cualquier subconjunto posible de variables 
independientes. 

Desafortunadamente, en ocasiones, el software puede trabajar “demasiado” para encon- 
trar una ecuación que cumpla con las singularidades de su conjunto de datos particular. La 
ecuación sugerida quizá no represente la relación en la población. Es necesario discernir para 
elegir entre las ecuaciones presentadas. Considere si los resultados son lógicos, si tienen una 
interpretación simple y si son consistentes con su conocimiento de la aplicación en estudio. 



La captura de pantalla de regresión respecto de restaurantes en Myrtle Beach se repite a continua- 
ción (vea las autoevaluaciones anteriores). 


Factor de 
predicción 

Coef 

SE Coef 


T 

valor p 

Constante 

2.50 

1.50 


1.667 

- 


3.00 

1.500 


2 . 000 

0 . 056 

*2 

4 . 00 

3 . 000 


1.333 

0 . 194 

X 3 

-3 . 00 

0.20 

- 

15 . 00 

0 . 000 

X 4 

0.20 

.05 


4 . 00 

0 . 000 

*5 

1 . 00 

1.50 


0 . 667 

0 . 511 

Análisis de 

la varianza 




Fuente 

DF 

SS 

MS 

F 

valor p 

Regresión 

5 

100 

20 

10 

0 . 000 

Error residual 20 

40 

2 



Total 

25 

140 





a) Realice una prueba de hipótesis global para verificar si algunos de los coeficientes de regresión 
son diferentes de 0. ¿Cuál es su decisión? Utilice el nivel de significancia 0.05. 

b) Haga una prueba individual de cada una de las variables independientes. ¿Qué variables consi- 
deraría eliminar? Utilice el nivel de significancia 0.05. 

c) Formule un plan para eliminar variables independientes. 


oonnect 


Ejercicios 

7. Con la siguiente captura de pantalla de regresión, 


Factor de 


predicción 

Coef 

SE Coef 

T 

P 


Constante 

84 . 998 

1.863 

45 . 61 

0 . 000 



2.391 

1.200 

1.99 

0 . 051 


*2 

-0.4086 

0 . 1717 

-2.38 

0 . 020 


Análisis de 

la varianza 




Fuente 

DF 

SS 

MS 

F 

P 

Regresión 

2 

77 . 907 

38 . 954 

4 . 14 

0 . 021 

Error residual 62 

583.693 

9.414 



Total 

64 

661.600 





responda las siguientes preguntas: 

a) Elabore la ecuación de regresión. 

b) Si Xt es 4 y X 2 es 1 1 , ¿cuál es el valor de la variable dependiente? 

c) ¿Cuál es el tamaño de la muestra? ¿Cuántas variables independientes hay? 

d) Realice una prueba de hipótesis global para verificar si alguno de los coeficientes de regresión 
del conjunto es diferente de 0. Utilice el nivel de significancia 0.05. ¿Cuál es su conclusión? 

e) Realice una prueba de hipótesis por cada variable independiente. Utilice el nivel de significan- 
cia 0.05. ¿Qué variables consideraría eliminar? 

f) Formule una estrategia para eliminar variables independientes en este caso. 
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8. La siguiente captura de pantalla de regresión se obtuvo de un estudio de empresas de arquitectu- 
ra. La variable dependiente es la cantidad total de honorarios, en millones de dólares. 


Factor de 


predicción 

Coef 

SE Coef 

T 

Valor p 

Constante 

7 . 987 

2.967 

2 .69 

- 


0 . 12242 

0.03121 

3 . 92 

0 . 000 

*2 

-0 . 12166 

0 . 05353 

-2.27 

0 . 028 

*3 

-0 . 06281 

0 . 03901 

-1.61 

0 . 114 

*4 

0 . 5235 

0 . 1420 

3 .69 

0 . 001 

*5 

-0 . 06472 

0.03999 

-1.62 

0 . 112 

Análisis de 

la varianza 



Fuente 

DF 

SS 

MS 

F Valor p 

Regresión 

5 

3710 . 00 

742 . 00 

12.89 0.000 

Error residual 46 

2647.38 

57 . 55 


Total 

51 

6357.38 




X-, es el número de arquitectos que trabajan en la compañía. 

X 2 es el número de ingenieros que trabajan en la compañía. 

X 3 es el número de años invertidos en proyectos de cuidado de la salud. 

X 4 es el número de estados en los que opera la empresa. 

X 5 es el porcentaje del trabajo de la empresa que se relaciona con el cuidado de la salud. 

a) Elabore la ecuación de regresión. 

b) ¿Cuál es el tamaño de la muestra? ¿Cuántas variables independientes hay? 

c) Realice una prueba de hipótesis global para ver si alguno de los coeficientes de regresión del 
conjunto puede ser diferente de 0. Utilice el nivel de significancia 0.05. ¿Cuál es su conclu- 
sión? 

d) Realice una prueba de hipótesis por cada variable independiente. Utilice el nivel de significan- 
cia 0.05. ¿Qué variables consideraría eliminar? 

e) Formule una estrategia para eliminar variables independientes en este caso. 

14.5 Evaluación de las suposiciones 
de la regresión múltiple 

En la sección anterior se describieron métodos para evaluar de manera estadística la ecuación 
de regresión múltiple. Los resultados de la prueba permitieron saber si al menos uno de los 
coeficientes no era igual a cero y se describió un proceso de evaluación de cada coeficiente 
de regresión. También se analizó el proceso de toma de decisiones para incluir y excluir varia- 
bles independientes en la ecuación de regresión múltiple. 

Es importante saber que la validez de las pruebas estadísticas global e individual parte de 
varias suposiciones. Es decir, si las suposiciones no son válidas, los resultados pueden estar 
sesgados o ser confusos. Sin embargo, se debe mencionar que en la práctica no siempre es 
posible un apego estricto a las suposiciones siguientes. Por fortuna, las técnicas estadísticas 
que se analizan en este capítulo parecen funcionar muy bien aunque se viole una o más de las 
suposiciones. Incluso si los valores de la ecuación de regresión múltiple tienen cierta “desvia- 
ción”, las estimaciones que proporciona estarán más cerca que cualquiera que se pudiera 
hacer de otra manera. En general, los procedimientos estadísticos son lo bastante robustos 
para superar las violaciones de algunas suposiciones. 

En el capítulo 13 se enumeraron las suposiciones necesarias para la regresión cuando se 
consideró sólo una variable independiente. (Vea la sección 13-8, página 490.) Las suposicio- 
nes de la regresión múltiple son similares. 

1 . Existe una relación lineal. Es decir, existe una relación directa entre la variable depen- 
diente y el conjunto de variables independientes. 
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2. La variación entre los residuos es la misma tanto en el caso de valores grandes 
como pequeños de Y. En otras palabras, ( Y - Y) no está relacionada, ya sea que / sea 
grande o pequeña. 

3. Los residuos siguen la distribución de probabilidad normal. Recuerde que el residuo 
es la diferencia entre el valor actual de Y y el valor estimado Y. Por lo tanto, el término 
(/ - Y) se calcula para cada observación del conjunto de datos. Estos residuos deberán 
seguir de manera aproximada una distribución de probabilidad normal. Además, la media 
de los residuos debe ser 0. 

4. Las variables independientes no deben estar correlacionadas. Es decir, conviene 
seleccionar un conjunto de variables independientes que no estén correlacionadas 
entre sí. 

5. Los residuos son independientes. Esto significa que las observaciones sucesivas de la 
variable dependiente no están correlacionadas. Esta suposición con frecuencia se viola 
cuando se comprende el tiempo con las observaciones muestreadas. 

En esta sección se presenta un análisis breve de cada una de estas suposiciones. Además, se 
proporcionan métodos para validarlas, y se señalan las consecuencias si no se cumplen. Para 
quienes estén interesados en un análisis adicional, una referencia excelente es Kutner, 
Nachtscheim, Neter y Li, Applied Linear Statistical Models, 5a. ed., McGraw-Hill, 2005. 


Relación lineal 

Primero se verá la suposición de linealidad. La idea es que la relación entre el conjunto de 
variables independientes y la variable dependiente es lineal. Si se consideran dos variables 
Independientes, se visualiza esta suposición. Las dos variables Independientes y la variable 
dependiente formarían un espacio tridimensional. Por ello, la ecuación de regresión formaría 
un plano, como se muestra en la página 514. Esta suposición se evalúa con diagramas de dis- 
persión y gráficas de residuos. 

Uso de los diagramas de puntos La evaluación de una ecuación de regresión múltiple 
siempre debe incluir un diagrama de dispersión en el que se trace la variable dependiente con- 
tra cada variable Independiente. Estos diagramas ayudan a visualizar las relaciones y propor- 
cionan una información inicial respecto de la dirección (positiva o negativa), la linealidad y la 
fuerza de la relación. Como ejemplo se analizan a continuación los diagramas de dispersión 
del caso del costo de calefacción. Las gráficas sugieren una relación muy fuerte, negativa y 
lineal entre el costo de calefacción y la temperatura, y una relación negativa entre el costo de 
OA6 Utilizar el análisis calefacción y el aislamiento, 

residual para evaluar las 

suposiciones del análisis de Uso de gráficas de residuos Recuerde que un residuo (V - Y) se calcula mediante la 

regresión múltiple. ecuación de regresión múltiple de cada observación en un conjunto de datos. En el capítulo 13 
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explicamos la ¡dea de que la mejor recta de regresión pasaba por el centro de los datos de un 
diagrama de dispersión. En este caso, aparece un número grande de observaciones arriba 
de la recta de regresión (estos residuos tendrían un signo positivo), y un número grande de 
observaciones debajo de ella (estos residuos tendrían un signo negativo). Además, las obser- 
vaciones estarían dispersas arriba y debajo de la recta, sobre todo el rango de la variable inde- 
pendiente. 

El mismo concepto es válido en el caso de la regresión múltiple, pero ésta no se puede 
representar de manera gráfica. Sin embargo, las gráficas de los residuos ayudan a evaluar la 
linealidad de la ecuación de regresión múltiple. Para Investigar este tema, los residuos se tra- 
zan en el eje vertical frente a la variable del factor de predicción, Y. En la siguiente gráfica a la 
izquierda se muestran los trazos residuales del ejemplo del costo de calefacción. Observe lo 
siguiente: 

• Los residuos se trazan en el eje vertical y están centrados respecto de cero. Hay residuos 
positivos y negativos. 

• Los trazos de los residuos muestran una distribución aleatoria de valores positivos y nega- 
tivos a lo largo de todo el rango de la variable trazada en el eje horizontal. 

• Los puntos están dispersos y no hay un patrón obvio, por lo que no hay razón para dudar 
de la suposición de linealidad. 

Este diagrama confirma la suposición de linealidad. 




Si hay un patrón en los puntos del diagrama de dispersión, es necesaria una Investigación adi- 
cional. Los puntos en la gráfica anterior derecha muestran residuos no aleatorios. Observe que 
la gráfica de los residuos no muestra una distribución aleatoria de valores positivos y negati- 
vos a lo largo de todo el rango de la variable trazada en el eje horizontal. En realidad, la gráfi- 
ca presenta una curvatura respecto de las gráficas de los residuos. Esto Indica que la relación 
quizá no sea lineal. En este caso, tal vez la ecuación sea cuadrática, lo que indica que se nece- 
sita el cuadrado de una de las variables. Esta posibilidad se analizó en el capítulo 13. 


La variación de los residuos es igual 

en el caso de valores grandes y pequeños de Y 

Este requisito indica que la variación respecto de los valores de predicción es constante, sin 
que importe si los valores de predicción son grandes o pequeños. Para citar un ejemplo espe- 
cífico, que puede violar la suposición, suponga que se utiliza la variable independiente Indivi- 
dual, antigüedad, para explicar la variación del ingreso. Se sospecha que conforme aumenta 
la antigüedad también aumenta el salario, pero también parece razonable que a medida que 
aumenta la antigüedad tal vez haya más variación respecto de la recta de regresión. Es decir, 
es probable que haya más variación del ingreso de una persona de 50 años de edad que de 
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una de 35. El requisito de una variación constante respecto de la recta de regresión se deno- 
mina homoscedasticidad. 


HOMOSCEDASTICIDAD La variación respecto de la ecuación de regresión es igual para todos 
los valores de las variables independientes. 


Para verificar la homoscedasticidad, los residuos se trazan contra los valores ajustados de Y. 
Ésta es la misma gráfica con la cual se evalúa la suposición de linealidad. (Vea la página 533.) 
Con base en el diagrama de puntos en esa captura de pantalla, es razonable concluir que esta 
suposición no se ha violado. 

Distribución de los residuos 

Para tener la seguridad de que las inferencias de las pruebas de hipótesis global e individual 
son válidas, se evalúa la distribución de los residuos. En un caso ideal, los residuos deberán 
seguir una distribución de probabilidad normal. 

Para evaluar esta suposición, los residuos se organizan en una distribución de frecuen- 
cias. A continuación se muestra el histograma en Minitab de los residuos del lado izquierdo 
para el ejemplo del costo de calefacción de una casa. Aunque es difícil demostrar que los resi- 
duos siguen una distribución normal sólo con 20 observaciones, parece que la suposición de 
normalidad es razonable. 

Minitab y Excel ofrecen otra gráfica que ayuda a evaluar la suposición de residuos con una 
distribución normal. Esta gráfica se denomina gráfica de probabilidad normal, y se encuen- 
tra a la derecha del histograma. Volveremos a describir esta gráfica en la sección 17-6, que 
comienza en la página 663. Básicamente, la gráfica de probabilidad normal confirma la supo- 
sición de residuos normalmente distribuidos si los puntos trazados están muy cerca de la recta 
trazada desde la izquierda inferior hasta la derecha superior de la gráfica. 




En este caso, las dos gráficas confirman la suposición de que los residuos siguen la distribu- 
ción de probabilidad normal. Por lo tanto, las inferencias que se hicieron con base en las hipó- 
tesis global e individual se confirman con los resultados de esta evaluación. 


Multicolinealidad 


OA7 Evaluar los efectos de 
las variables independientes 
correlacionadas. 


La multicolinealidad existe cuando las variables independientes están correlacionadas. Las 
variables independientes correlacionadas dificultan las inferencias acerca de los coeficientes 
de regresión individuales y sus efectos individuales sobre la variable dependiente. En la prác- 
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tica, es casi imposible seleccionar variables que carezcan por completo de alguna relación. En 
otras palabras, es casi imposible crear un conjunto de variables independientes que no estén 
correlacionadas hasta cierto punto. Sin embargo, la comprensión general del punto de multi- 
colinealidad es importante. 

Primero, se debe destacar que la multicolinealidad no afecta la capacidad de una ecua- 
ción de regresión múltiple para predecir la variable dependiente. No obstante, cuando se tenga 
interés en evaluar la relación entre cada variable independiente y la variable dependiente, la 
multicolinealidad puede presentar resultados inesperados. 

Por ejemplo, si se usan dos promedios de calificaciones de preparatoria con multicolinea- 
lidad muy alta y la clasificación de un grupo de preparatoria para predecir el promedio de cali- 
ficaciones de los alumnos de ingreso a la universidad (variable dependiente), se esperaría que 
las dos variables independientes estén positivamente relacionadas con la variable dependien- 
te. Sin embargo, como las variables independientes están muy correlacionadas, una de las 
variables independientes puede tener un signo negativo inesperado e inexplicable. En esen- 
cia, estas dos variables independientes son redundantes cuando se trata de explicar la misma 
variación de la variable dependiente. 

Una segunda razón para evitar variables independientes correlacionadas es que pueden 
generar resultados erróneos en las pruebas de hipótesis de las variables independientes indi- 
viduales. Esto se debe a la inestabilidad del error estándar de estimación. Varias pistas que 
indican problemas con la multicolinealidad incluyen lo siguiente: 

1 . Una variable independiente conocida como factor de predicción importante resulta con un 
coeficiente de regresión que no es significativo. 

2. Un coeficiente de regresión que debiera tener un signo positivo resulta negativo, o lo con- 
trario. 

3. Cuando se agrega o elimina una variable independiente, hay un cambio drástico de los 
valores de los coeficientes de regresión restantes. 

En nuestra evaluación de una ecuación de regresión múltiple, una aproximación para reducir 
los efectos de la multicolinealidad es seleccionar con cuidado las variables independientes 
incluidas en la ecuación de regresión. Una regla general es que, si la correlación entre dos 
variables independientes se encuentra entre —0.70 y 0.70, es probable que no haya problema 
al emplear las dos variables independientes. Una prueba más precisa es utilizar el factor de 
inflación de la varianza, el cual por lo general se escribe VIF. El valor de VIF se determina 
como sigue: 


f " 

FACTOR DE INFLACIÓN DE LA VARIANZA 

V 


VIF = 


1 -Rf 


\ 

( 14 - 7 ) 


J 


El término Rf se refiere al coeficiente de determinación, donde la variable independiente selec- 
cionada sirve como una variable dependiente, y las variables independientes restantes, como 
variables independientes. Un VIF mayor que 10 se considera insatisfactorio, e indica que la va- 
riable independiente se debe eliminar del análisis. En el siguiente ejemplo se explican los deta- 
lles de la determinación del VIF. 


r 

Cjemplo 

Consulte los datos en la tabla 14-1, donde se relaciona el costo de calefacción con las varia- 
bles independientes: temperatura externa, cantidad de aislamiento y antigüedad del calenta- 


dor. Elabore una matriz de correlación de las tres variables independientes. ¿Parece que hay 
un problema con la multicolinealidad? Encuentre e interprete el factor de inflación de la varian- 
za de cada una de las variables independientes. 
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Solución 




Primero emplee el sistema Minitab para determinar la matriz de correlación de la variable 
dependiente y las cuatro variables independientes. Una parte de esa captura de pantalla es la 
siguiente: 


Costo 

Temperatura —0.812 
Aislamiento —0.257 
Ant igüedad 0.537 


Temp Insul 
-0 . 103 

-0.486 0.064 


Contenido de la celda: Correlación de Pearson 


El área resaltada indica la correlación entre las variables independientes. Ninguna de las corre- 
laciones entre ellas sobrepasa -0.70 ni 0.70, por lo que no se sospechan problemas con mul- 
ticolinealidad. La correlación mayor entre las variables independientes es -0.486 entre anti- 
güedad y temperatura. 

Para confirmar esta conclusión calcule el VIF de cada una de las tres variables indepen- 
dientes. Primero se considera la variable independiente, temperatura. Emplee Minitab para 
determinar el coeficiente de determinación múltiple con la temperatura como variable depen- 
diente, y la cantidad de aislamiento y antigüedad del calentador como variables independien- 
tes. La captura de pantalla de Minitab es la siguiente. 


Análisis de regresión: Temperatura vs Aislamiento, Antigüedad 


La ecuación de regresión es 

Temp = 58.0 — 0.51 Aislamiento — 2.51 Antigüedad 


Factor de 


Predicción 

Coef 

SE Coef 

T 

P 


Constante 

57.99 

12.35 

4 . 70 

0 . 000 


Aislamiento 

-0.509 

1.488 

-0.34 

0 . 737 


Antigüedad 

-2.509 

1.103 

-2.27 

0 . 036 


S = 16.0311 

R al 

cuadrado = 

24 . 1% 

R al cuadrado (¡ 

Análisis de 

la varianza 




Fuente 

GL 

SS 

MS 

F 

P 

Regresión 

2 

1390.3 

695 . 1 

2.70 

0 . 096 

Error residual 17 

4368.9 

257 . 0 



Total 

19 

5759.2 





15.2% 


El coeficiente de determinación es 0.241 , por lo que al sustituir este valor en la fórmula del VIF: 


VIF 


1 

1 -ñ? 


1 

1 - .241 


1.32 


El valor del VIF de 1 .32 es menor que el límite superior de 1 0, lo que indica que la variable inde- 
pendiente, temperatura, no está muy correlacionada con las demás variables independientes. 

Una vez más, para determinar el VIF del aislamiento se debe desarrollar una ecuación de 
regresión con el aislamiento como variable dependiente, y la temperatura y antigüedad del 
calentador como variables independientes. Establezca el coeficiente de determinación de esta 
ecuación. Éste sería el valor de R¡. Este valor se sustituiría en la ecuación 14-7, y se despeja- 
ría para el VIF. 

Por fortuna, Minitab genera los valores del VIF de cada una de las variables independien- 
tes, los cuales se reportan en la columna derecha con el encabezado “VIF" de la captura de 
pantalla de Minitab. Los dos valores son 1.0, de aquí que se concluya que no hay problema 
de multicolinealidad en este ejemplo. 


La ecuación de regresión es 

Costo = 427 - 4.58 Temp - 14.8 Aisl + 6.10 Antig 


Factor de 


predicción 

Coef 

SE Coef 

T 

P 

VIF 

Constante 

427 . 19 

59.60 

7 . 17 

0 . 000 


Temperatura 

-4 . 5827 

0 . 7723 

-5.93 

0 . 000 

1.318 

Aislamiento 

-14 . 831 

4 . 754 

-3 . 12 

0 . 007 

1 . 011 

Antigüedad 

-6 . 101 

4 . 012 

1.52 

0 . 148 

1.310 
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Observaciones independientes 

La quinta suposición respecto del análisis de regresión y correlación es que los residuos suce- 
sivos deberán ser independientes. Esto significa que los residuos no tienen un patrón, que no 
están muy correlacionados, y que no hay corridas largas de residuos positivos o negativos. 
Cuando los residuos sucesivos están correlacionados, a esta condición se le conoce como 

autocorrelación. 

La autocorrelación se presenta con frecuencia cuando los datos se colectan durante un 
periodo. Por ejemplo, se desea predecir las ventas anuales de Ages Software, Inc., con base 
en el tiempo y la cantidad gastada en publicidad. La variable dependiente son las ventas anua- 
les, y las variables independientes son el tiempo y la cantidad gastada en publicidad. Es pro- 
bable que, en un periodo, los puntos actuales estén arriba del plano de regresión (recuerde 
que hay dos variables independientes), y después, en otro periodo, los puntos estén debajo 
del plano de regresión. En la gráfica siguiente se muestran los residuos graficados en el eje 
vertical, y los valores ajustados Y, en el horizontal. Observe la corrida de residuos arriba de la 
media de los residuos, seguida por una corrida debajo de la media. Este diagrama de disper- 
sión indica una posible autocorrelación. 


Residuos (Y- Y) 

O 

• *• 

• • • 

• * . 

• • \ • 

•• • 

• 


Valores ajustados Y 


Existe una prueba para la autocorrelación, denominada Durbin-Watson. En el capítulo 16, sec- 
ción 16-10, se presentan los detalles de esta prueba. 


OA8 Evaluar y utilizar 
variables independientes 
cualitativas. 



Estadística en acción 

En años recientes se ha 
empleado la regresión 
múltiple en diversos pro- 
cesos legales. Es particu- 
larmente útil en casos 
contra la discriminación 
por género o raza. Por 

(i continúa ) 


14.6 Variables independientes cualitativas 

En el ejemplo anterior respecto del costo de calefacción, las dos variables independientes, 
temperatura externa y aislamiento, fueron cuantitativas; es decir, de naturaleza numérica. Con 
frecuencia, en el análisis se desea emplear variables de escala nominal, como género, si la 
casa tiene alberca, o si el equipo fue local o visitante. Estas variables se denominan variables 
cualitativas, debido a que describen una cualidad particular, como masculino o femenino. 
Para utilizar una variable cualitativa en el análisis de regresión, se emplea un esquema de 
variables ficticias, en el cual una de las dos condiciones posibles se codifica con un 0 o un 1 . 


VARIABLE FICTICIA Variable en la que sólo existen dos resultados posibles. Para el análisis, 
uno de los resultados se codifica con un 1 y el otro con un 0. 


Por ejemplo, tiene interés en estimar el salario de un ejecutivo con base en los años de su 
experiencia laboral y si él o ella se graduó o no de la universidad. “Graduación de la universi- 
dad” sólo puede adoptar una de dos condiciones: sí o no. Por lo tanto, se considera una varia- 
ble cualitativa. 

Suponga que en el ejemplo de Salsberry Realty se agrega la variable independiente “gara- 
je”. Para las casas sin garaje, se utiliza 0; para las que sí tienen se emplea 1. A la variable 
“garaje” se le designará X 4 . Los datos de la tabla 14-2 se ingresan en el sistema Minitab. 
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ejemplo, suponga que 
una mujer afirma que los 
salarios de la compañía X 
son injustos para ellas. 
Para afirmar su reclamo, 
la demandante presenta 
datos para demostrar 
que, en promedio, las 
mujeres ganan menos 
que los hombres. En res- 
puesta, la compañía X 
argumenta que sus sala- 
rios se basan en experien- 
cia, capacitación y 
aptitudes, y que sus 
empleadas femeninas en 
promedio son más jóve- 
nes y con menos capaci- 
tación que los varones. 
También, como argu- 
mento adicional, la com- 
pañía podría afirmar que 
la situación actual en rea- 
lidad se debe a sus esfuer- 
zos exitosos para 
contratar a más mujeres. 


TABLA 14-2 Costo de calefacción de las casas, temperatura, aislamiento y garaje de una muestra 
de 20 casas 


Costo, 

Y 

Temperatura, 

Aislamiento, 

X 2 

Garaje, 

*4 

$250 

35 

3 

0 

360 

29 

4 

1 

165 

36 

7 

0 

43 

60 

6 

0 

92 

65 

5 

0 

200 

30 

5 

0 

355 

10 

6 

1 

290 

7 

10 

1 

230 

21 

9 

0 

120 

55 

2 

0 

73 

54 

12 

0 

205 

48 

5 

1 

400 

20 

5 

1 

320 

39 

4 

1 

72 

60 

8 

0 

272 

20 

5 

1 

94 

58 

7 

0 

190 

40 

8 

1 

235 

27 

9 

0 

139 

30 

7 

0 


La captura de pantalla de Minitab es: 



UOIJ 

• 

ti 

a 

O 

U 

R+gr»ttton Anilytu Cotí voroui Tota*. Intuí. Car «94 

TH* If 


CMt 

i«» 

lusa! 

Girafi 

4 

43 

60 

9 

o‘ 

* 

tt 

66 

6 

0 

Co»t . 394 - 3.** Ta, • 11.3 latal . 77.4 Caap 

c 

200 

30 

6 

0 


t 

366 

10 

6 

1 

liMl«« (M( 3C Cmí T 7 






(«aúne 393.47 41.00 4.13 «.909 

a 

290 

7 

10 

1 

Trae .3.9449 0.4337 -4.07 0.009 

* 

230 

21 

9 

0 

llwl -11,334 4.002 -2.93 0.912 

w 

120 

96 

2 

0 

TI. 43 22.19 3.4 C 0.004 

11 

n 

64 

12 

0 


u 

206 

48 

6 

r 

S • 41.01*4 • 17. •% I-S4444)) - 44. V* 

1) 

400 

20 

i 

il 


14 
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39 

4 

1 
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tí 

22 

90 

B 

QJ 
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20 

6 

T 
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o 

94 

68 

7 

0 

ti toe U 2771) 17)2 






T4141 19 112914 

«9 

190 

40 

8 

i 


1 » 

236 

22 

* 

0 


79 

139 

30 

7 

0 

t>r un 13 

Tea» 1 14921) 

71 





IftMl 1 14*00 

27 





Ctmgt 1 20000 

2 ) 






[iU 1 

LíJ 1 iT 


¿Cuál es el efecto de la variable “garaje”? ¿Se debe incluir en el análisis? Para mostrar el 
efecto de la variable, suponga que se tienen dos casas exactamente iguales, una al lado de la 
otra, en Buffalo, Nueva York; una tiene garaje, y la otra no. Las dos casas tienen 3 pulgadas 
de aislamiento y la temperatura media en enero en Buffalo es de 20 grados. Para la casa sin 
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garaje, O se sustituye porX 4 en la ecuación de regresión. El costo estimado de la calefacción 
es de $280.90, determinado por: 

Y = 394 - 3.96X 1 - 1 1 ,3X 2 + 77.4X 4 

= 394 - 3.96(20) - 1 1 .3(3) + 77.4(0) = 280.90 

En la casa con garaje, 1 se sustituye porX 4 en la ecuación de regresión. El costo estimado de 
la calefacción es de $358.30, determinado por: 

Y = 394 - 3.96^ - 1 1 ,3X 2 + 77.4X 4 

= 394 - 3.96(20) - 11.3(3) + 77.4(1) = 358.30 

La diferencia entre los dos costos de calefacción estimados es de $77.40 ($358.30 - $280.90). 
Por lo tanto, es de esperar que el costo para calentar la casa con un garaje sea $77.40 más 
alto que el de una casa equivalente sin garaje. 

Se demostró que la diferencia entre los dos tipos de casas es de $77.40, pero, ¿es signi- 
ficativa la diferencia? Para responder, realice la siguiente prueba de hipótesis. 


H 0 : @ 4 — 0 


Hp p 4 * 0 


La información necesaria para responder esta pregunta se encuentra en la captura de panta- 
lla de Minitab anterior. El coeficiente de regresión de la variable independiente, garaje, es 
77.43, y la desviación estándar de la distribución de muestreo es 22.78. Ésta se identifica 
como la cuarta variable independiente, por lo que se emplea un subíndice de 4. Por último, 
estos valores se sustituyen en la fórmula (14-6). 


fc> 4 ~ 0 

s b. 


77.43 - 0 
22.78 


3.40 


Hay tres variables independientes en el análisis, por lo cual hay n - (k + 1) = 20 - (3 + 1) 
= 16 grados de libertad. El valor crítico del apéndice B.2 es 2.120. La regla de decisión, con 
una prueba de dos colas y un nivel de significancia de 0.05, es rechazar H 0 si la t calculada se 
encuentra a la izquierda de —2.120 o bien a la derecha de 2.120. Como el valor calculado de 
3.40 se encuentra a la derecha, se rechaza la hipótesis nula. Se concluye que el coeficiente 
de regresión no es cero. La variable independiente, garaje, se debe incluir en el análisis. 

Utilizando el método del valor p, el valor t calculado de 3.40 tiene un valor p de 0.004. Este 
valor es menor que el nivel de significancia 0.05. Por lo tanto, se rechaza la hipótesis nula. Se 
concluye que el coeficiente de regresión no es cero, y que la variable independiente garaje 
debe ser incluida en el análisis. 

¿Puede emplear una variable cualitativa con más de dos resultados posibles? Sí, pero el 
esquema de codificación se complica y requiere una serie de variables ficticias. Para explicar 
esto, suponga que una compañía estudia sus ventas, pues se relacionan con el gasto en publi- 
cidad trimestral durante los últimos 5 años. Suponga que las ventas son la variable dependien- 
te, y el gasto en publicidad, la primera variable independiente, X 1 . Para incluir la información 
cualitativa respecto del trimestre, se utilizan tres variables independientes adicionales. En el 
caso de la variable X 2 , las cinco observaciones que se refieren al primer trimestre de cada uno 
de los 5 años se codifican 1 , y los otros trimestres, 0. De manera similar, en el de X 3 las cinco 
primeras observaciones referentes al segundo trimestre se codifican 1, y los otros trimestres, 
0. En el de X 4 , las cinco observaciones referentes al tercer trimestre se codifican 1 , y los otros 
trimestres, 0. Una observación que no se refiera a ninguno de los primeros trimestres se debe 
referir al cuarto trimestre, por lo que no es necesaria una variable independiente distinta con- 
cerniente a este trimestre. 
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En un estudio de la American Realtors Association se investigó la relación entre las comisiones para 
los agentes de ventas el año pasado y el número de meses desde que obtuvieron sus licencias 
para operar en el sector. También es de interés en el estudio el género de ios agentes de ventas. A 
continuación se presenta una parte de la captura de pantalla de la regresión. La variable dependien- 
te es comisiones, reportadas en miles de dólares, y las variables independientes son los meses 
desde que se obtuvo ia licencia y el género (mujer = 1 y hombre = 0). 


n 20 
k 2 


Análisis de 
R 2 

R 2 ajustada 
R 

Error 

estándar 


regresión 
0.642 
0 .600 
0 .801 

3.219 


Dep . Var . 


Commissions 


Tabla ANOVA 


Fuente 

SS 

df 

MS 

F 

p-value 



Regresión 

315 . 9291 

2 

157 . 9645 

15.25 


0002 



Residuo 

176 . 1284 

17 

10.3605 






Total 

492 . 0575 

19 







Salida de la 

regresión 


error 






Variables 

coeficientes 


estándar 

t (gl 

= 17) 

valor p 

95% menor 

95% mayor 

Intersección 

15 . 7625 


3 . 0782 


5 . 121 

. 0001 

9.2680 

22 . 2570 

Meses 

0.4415 


0 . 0839 


5.263 

. 0001 

0.2645 

0 . 6186 

Género 

3 . 8598 


1.4724 


2 . 621 

. 0179 

0.7533 

6 . 9663 


a) Escriba la ecuación de regresión. ¿Qué comisión esperaría para una agente que obtuvo su licen- 
cia hace 30 meses? 

b ) ¿En promedio, las agentes ganan más o menos que sus colegas masculinos? ¿Cuánto más? 

c) Realice una prueba de hipótesis para determinar si se debe incluir ia variable independiente 
género en el análisis. Utilice el nivel de significancia 0.05. ¿Cuál es su conclusión? 


14.7 Modelos de regresión con interacción 

OA9 Comprendere En el capítulo 12 se analizó la Interacción entre variables independientes. Para explicar este 

interpretar la posible tema, suponga que se estudia la pérdida de peso y, además, como se sugiere en la informa- 

interacción entre variables c ¡ón actual, que la dieta y el ejercicio están relacionados. Por lo tanto, la variable dependlen- 

independientes. te es la cantidad de cambio de peso, y las variables independientes son: dieta (sí o no) y 

ejercicio (nada, moderado, significativo). El interés es saber si existe una Interacción entre las 
variables independientes. Es decir, si los individuos estudiados son constantes con su dieta y 
ejercicio, ¿aumentará la cantidad media de pérdida de peso? ¿Es mayor la pérdida de peso 
total que la suma de la pérdida debida al efecto de la dieta y la pérdida debida al efecto del 
ejercicio? 

Amplíe esta idea. En lugar de tener dos variables en escala nominal, dieta y ejercicio, se 
puede examinar el efecto (interacción) de varias variables en escala de razón. Otro ejemplo: 
suponga que desea estudiar el efecto de la temperatura ambiente (68, 72, 76, u 80 grados 
Fahrenheit) y el nivel de ruido (60, 70, u 80 decibeles) en el número de unidades producidas. 
En otras palabras, ¿tiene algún efecto la combinación de nivel de ruido y temperatura en el 
recinto sobre la productividad de los trabajadores? ¿Producirán más unidades en un recinto 
en calma y frío que quienes trabajan en un recinto caluroso y ruidoso? 

En el análisis de regresión, la interacción se examina como variable independiente sepa- 
rada. Se desarrolla una interacción de la variable de predicción al multiplicar los valores de los 
datos de una variable independiente por los valores en otra variable independiente, y, por 
ende, al crear una nueva variable independiente. Un modelo de dos variables que incluye un 
término de interacción es: 


Y — a + + P2X2 + ($3X^2 
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El término X-,X 2 es el término de interacción. Esta variable se creó al multiplicar los valores de 
X-, y X 2 para crear la tercera variable independiente. Luego se desarrolló una ecuación 
de regresión con las tres variables Independientes y se probó la significancia de la tercera 
variable Independiente con la prueba individual para variables independientes, descrita antes 
en este capítulo. Un ejemplo ¡lustrará los detalles. 


Cjemplo 


Solución 


Consulte el ejemplo del costo de calefacción y los datos de la tabla 14-1. ¿Hay alguna interac- 
ción entre la temperatura externa y la cantidad de aislamiento? Si las dos variables crecen, 
¿será mayor el efecto en el costo de calefacción que la suma de los ahorros de temperatura 
más cálida y los ahorros de mayor aislamiento, por separado? 

A continuación se repite la información de la tabla 14-1 sobre las variables independientes, tem- 
peratura e aislamiento. La variable de interacción se crea al multiplicar la variable temperatura 
por el aislamiento. En la primera casa muestreada, el valor de la temperatura es de 35 grados, 
y el del aislamiento, de 3 pulgadas, por lo que el valor de la variable de interacción es 35 X 3 = 
105. Los valores de los otros productos de interacción se determinan de manera similar. 



La regresión múltiple se encuentra al aplicar la temperatura, aislamiento e interacción de la tem- 
peratura y el aislamiento como variables independientes. La siguiente es la ecuación de regre- 
sión. 

Y = 598.070 - 7.81 1 - 30.1 61X 2 + 0.385X^2 

La pregunta que se desea responder es si la variable de interacción es significativa. Se utiliza- 
rá el nivel de significancia 0.05. En términos de una hipótesis: 

Hq. p3 = 0 
Hi'- p3 ^ 0 


Hay n — (k + 1) = 20 - (3 + 1) = 16 grados de libertad. Con el nivel de significancia de 0.05 
y una prueba de dos colas, los valores críticos de t son -2.120 y 2.120. La hipótesis nula se 
rechaza si t es menor que -2.120, o bien si t es mayor que 2.120. De la salida, b 3 = 0.385 y 
s b3 = 0.291 . Para determinar el valor de t emplee la fórmula (14-6). 


b 3 - 0 _ 0.385 - 0 
s b3 ” 0.291 


1.324 


Como el valor calculado de 1 .324 es menor que el valor crítico de 2.120, no se rechaza la hipó- 
tesis nula. Además, el valor p de 0.204 rebasa 0.05. Se concluye que no hay una interacción 
significativa entre la temperatura y el aislamiento. 
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OAIO Explicar la regresión 
por pasos. 


Hay otras situaciones que pueden tener lugar cuando se estudia la Interacción entre variables 
independientes. 

1. Es posible tener una interacción de tres vías entre las variables independientes. En el 
ejemplo del costo de la calefacción, podría haber considerado la interacción de tres vías 
entre temperatura, aislamiento y antigüedad del calentador. 

2. Es posible que exista interacción donde una de las variables independientes esté en esca- 
la nominal. En el ejemplo del costo de calefacción, podría haber estudiado la interacción 
entre temperatura y garaje. 

Estudiar todas las Interacciones posibles puede ser muy complejo. Sin embargo, con frecuen- 
cia una consideración cuidadosa de todas ellas proporciona una visión útil de los modelos de 
regresión. 


14.8 Regresión por pasos 

En el ejemplo del costo de calefacción (vea la información muestral en las tablas 14-1 y 14-2) 
se consideraron cuatro variables Independientes: temperatura externa media, cantidad de ais- 
lamiento en la casa, antigüedad del calentador, y si había garaje o no. Para elaborar la ecua- 
ción, primero realizó una prueba global o “todo de una vez” para determinar si alguno de los 
coeficientes de regresión era significativo. Cuando determinó que al menos uno era significa- 
tivo, probó los coeficientes de regresión de manera individual para ver cuáles eran importan- 
tes. No incorporó las variables independientes que no tenían coeficientes de regresión 
significativos, e incorporó las otras. Al retener las variables independientes con coeficien- 
tes significativos, determinó la ecuación de regresión en la que se empleó el número menor de 
variables independientes. Esto facilitó interpretar la ecuación de regresión y explicó tanta va- 
riación como fue posible de la variable dependiente. 

Ahora se describe la técnica denominada regresión por pasos, más eficiente para deter- 
minar la ecuación de regresión. 


REGRESIÓN POR PASOS Método paso por paso para determinar la ecuación de regresión que 
se inicia con una sola variable independiente y agrega o elimina variables independientes 
una por una. En la ecuación de regresión sólo se incluyen las variables independientes con 
coeficientes de regresión distintos de cero. 


En el método por pasos se desarrolla una secuencia de ecuaciones. La primera de ellas sólo 
contiene una variable independiente. Sin embargo, ésta proviene del conjunto propuesto de 
variables independientes que explica la mayoría de la variación de la variable dependiente. En 
otras palabras, si calcula todas las correlaciones simples entre cada una de las variables inde- 
pendientes y la variable dependiente, en el método por pasos primero se selecciona la varia- 
ble independiente que tiene la correlación más fuerte con la variable dependiente. 

Luego, en este método se analizan las variables Independientes y después se selecciona 
la que explicará el porcentaje mayor de la variación aún no explicada. Este proceso continúa 
hasta incluir en la ecuación de regresión todas las variables independientes con coeficientes 
de regresión significativos. Las ventajas del método por pasos son: 

1. Sólo se ingresan en la ecuación las variables independientes con coeficientes de regre- 
sión significativos. 

2. Los pasos comprendidos en el desarrollo de la ecuación de regresión son claros. 

3. Es eficaz para determinar la ecuación de regresión sólo con coeficientes de regresión sig- 
nificativos. 

4. Se muestran los cambios del error estándar de estimación múltiple y el coeficiente de 
determinación. 


14.8 Regresión por pasos 


543 


La captura de pantalla de Mlnitab del método por pasos en el caso del problema del costo de 
calefacción es la siguiente. Observe que la ecuación final, la cual se reporta en la columna 
número 3, incluye las variables independientes temperatura, garaje y aislamiento. Son las mis- 
mas variables independientes que se incluyeron en la ecuación de la prueba global y la prue- 
ba de variables independientes Individuales. (Vea la página 538.) No se incluye la variable 
independiente, antigüedad, la edad del calentador, debido a que no es un factor de predicción 
significativo del costo. 



Lo siguiente es el repaso del método por pasos y la interpretación de la captura de pantalla: 

1. En el procedimiento por pasos primero se selecciona la variable independiente, en este 
caso, temperatura. Esta variable explica más de la variación del costo de calefacción que 
cualquiera otra de las tres variables independientes propuestas. La temperatura explica 
65.85% de la variación del costo de calefacción. La ecuación de regresión es: 

Y = 388.8 - 4.93^ 

Existe una relación inversa entre el costo de calefacción y la temperatura. Por cada grado 
de aumento de temperatura, el costo de calefacción se reduce $4.93. 

2. La siguiente variable Independiente por considerar en la ecuación de regresión es garaje. 
Cuando se agrega esta variable, el coeficiente de determinación aumenta de 65.85% a 
80.46%. Es decir, al agregar garaje como variable independiente, el coeficiente de deter- 
minación aumenta 14.61 %. La ecuación de regresión después del paso 2 es: 

Y = 300.3 - 3.56X-, + 93.0X 2 

En general, los coeficientes de regresión cambiarán de un paso al otro. En este caso, el 
coeficiente de la temperatura retuvo su signo negativo, pero cambió de -4.93 a —3.56. 
Este cambio se debe a la influencia agregada de la variable Independiente, garaje. ¿Por 
qué en el método por pasos se seleccionó garaje como la variable independiente en lugar 
de aislamiento o antigüedad? El aumento en R 2 , el coeficiente de determinación, es mayor 
si se Incluye garaje en lugar de cualquiera de las otras dos variables. 

3. En este punto hay dos variables que no se han usado, aislamiento y antigüedad. Observe 
que en el tercer paso se selecciona aislamiento y después se detiene el procedimiento. 
Esto indica que la variable aislamiento explica más de la variación restante del costo de 
calefacción que lo que explica la variable antigüedad. Después del tercer paso, la ecua- 
ción de regresión es: 


Y= 393.7 - 3.96X 1 + 77.0X 2 - 11.3X 3 
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Hasta aquí, 86.98% de la variación del costo de calefacción se explica por las tres varia- 
bles independientes, temperatura, garaje e aislamiento. Éste es el mismo valor R 2 y la 
misma ecuación de regresión determinados en la página 538, excepto por diferencias de 
redondeo. 

4. En esta etapa se detiene el procedimiento por pasos. Esto significa que la variable inde- 
pendiente, antigüedad, no contribuye de manera significativa al coeficiente de determina- 
ción. 

En el método por pasos se desarrolló la misma ecuación de regresión, seleccionó las mismas 
variables independientes y determinó el mismo coeficiente de determinación que en las prue- 
bas global e individual descritas antes en este capítulo. Las ventajas del método por pasos es 
que es más directo que una combinación de los procedimientos global e individual. 

También hay otros métodos para seleccionar variables. Al método por pasos también se 
le denomina método de selección hacia adelante, debido a que se inicia sin variables inde- 
pendientes y agrega una variable independiente a la ecuación de regresión en cada iteración. 
Asimismo existe el método de eliminación hacia atrás, que comienza con todo el conjunto 
de variables y elimina una variable independiente en cada iteración. 

En los métodos descritos hasta aquí se considera una variable a la vez, y se decide si se 
incluye o se elimina esa variable. Otro enfoque es la regresión del mejor subconjunto. En 
este método se considera el mejor modelo con una variable independiente, el mejor modelo 
con dos variables independientes, el mejor modelo con tres, y así sucesivamente. El criterio es 
encontrar el modelo con el valor R 2 mayor, sin que importe el número de variables indepen- 
dientes. Asimismo, no es necesario que cada una de ellas tenga un coeficiente de regresión 
distinto de cero. Como cada variable independiente puede incluirse o no, hay 2 k - 1 mode- 
los posibles, donde k se refiere al número de variables independientes. En el ejemplo del costo 
de calefacción hay cuatro variables independientes, por lo que hay 15 modelos de regresión 
posibles, determinados por 2 4 - 1 =16-1 =15. Todos los modelos de regresión se exami- 
narían con una variable independiente, todas las combinaciones con dos variables indepen- 
dientes, todas las combinaciones con tres variables independientes, y la posibilidad de utilizar 
las cuatro variables independientes. La ventaja del método del mejor subconjunto es que 
ayuda a examinar combinaciones de variables independientes no consideradas en el método 
por pasos. Este proceso se encuentra disponible en Minitab y MegaStat. 


comect 


Ejercicios 

9. El gerente de producción de High Point Sofá and Chair, importante fabricante de muebles ubica- 
do en Carolina del Norte, estudia las calificaciones de desempeño laboral de una muestra de 15 
electricistas de mantenimiento empleados en la compañía. Para ingresar al departamento de man- 
tenimiento eléctrico, el departamento de recursos humanos les aplica un examen de aptitud. El 
gerente de producción obtuvo la calificación de cada electricista incluido en la muestra. Además, 
determinó cuáles electricistas eran miembros de un sindicato (código = 1) y cuáles no lo eran 
(código = 0). La información muestral es la siguiente. ^ 


Trabajador 

Calificación de 
desempeño laboral 

Calificación en el 
examen de aptitud 

Miembro 
de sindicato 

Abbott 

58 

5 

0 

Anderson 

53 

4 

0 

Bender 

33 

10 

0 

Bush 

97 

10 

0 

Center 

36 

2 

0 

Coombs 

83 

7 

0 

Eckstine 

67 

6 

0 

Gloss 

84 

9 

0 

Herd 

98 

9 

1 
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Trabajador 

Calificación de 
desempeño laboral 

Calificación en el 
examen de aptitud 

Miembro 
de sindicato 

Householder 

45 

2 

1 

lori 

97 

8 

1 

Lindstrom 

90 

6 

1 

Masón 

96 

7 

1 

Pierse 

66 

3 

1 

Rohde 

82 

6 

1 


a) Utilice un paquete de software estadístico para desarrollar una ecuación de regresión múltiple 
con la calificación de desempeño laboral como variable dependiente, y la calificación en el 
examen de aptitud y pertenencia a un sindicato como variables independientes. 

b) Comente sobre la ecuación de regresión. Incluya el coeficiente de determinación y el efecto de 
la pertenencia o no a un sindicato. ¿Son eficaces estas dos variables para explicar la variación 
del desempeño laboral? 

c) Realice una prueba de hipótesis para determinar si la pertenencia a un sindicato se debe incluir 
como variable independiente. 

d) Repita el análisis considerando los términos de interacción posibles. 

10. La Cincinnati Paint Company vende marcas de pintura de prestigio en ferreterías en Estados 
Unidos. La compañía mantiene una fuerza laboral numerosa, cuya tarea es atender a clientes 
actuales, así como buscar nuevos compradores. El gerente nacional de ventas investiga la rela- 
ción entre el número de llamadas de ventas y las millas que recorren los agentes de ventas. 
¿Ganan más en comisiones por ventas los agentes que recorren más millas y hacen más llama- 
das? Para investigar esta cuestión, el vicepresidente de ventas seleccionó una muestra de 25 
agentes y determinó: Wl 

• La cantidad que ganaron por comisiones el mes pasado {Y). 

• El número de millas que recorrieron el mes pasado (X-,). 

• El número de llamadas de ventas del mes pasado (X 2 ). 

La información se reporta en la siguiente tabla: 


Comisiones (en 
miles de dólares) 

Llamadas 

Millas 

recorridas 

22 

139 

2 371 

13 

132 

2 226 

33 

144 

2 731 

25 

127 

2 671 

43 

154 

2 988 

34 

147 

2 829 


Formule una ecuación de regresión que incluya un término de interacción. ¿Hay una interacción 
significativa entre el número de llamadas de ventas y las millas recorridas? 

11. Un coleccionista de arte estudia la relación entre el precio de venta de una pintura y dos variables 
independientes: el número de postores en la subasta particular y la antigüedad de la pintura, en 
años. Una muestra de 25 pinturas reveló la siguiente información muestral. 


Pintura 

Precio en 
la subasta 

Postores 

Edad 

1 

3 470 

10 

67 

2 

3 500 

8 

56 

3 

3 700 

7 

73 

23 

4 660 

5 

94 

24 

4 710 

3 

88 

25 

4 880 

1 

84 
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a) Formule una ecuación de regresión múltiple con el número de variables independientes de 
postores y la antigüedad de la pintura para estimar el precio en la subasta de la variable depen- 
diente. Analice la ecuación. ¿Le sorprende que haya una relación inversa entre el número de 
postores y el precio de la pintura? 

b) Formule una variable de interacción e inclúyala en la ecuación de regresión. Explique el signi- 
ficado de la interacción. ¿Es significativa esta variable? 

c) Utilice el método por pasos y las variables independientes número de postores y antigüedad 
de la pintura así como la interacción entre ambas. ¿Qué variables seleccionaría? 

12. Un constructor de bienes raíces desea estudiar la relación entre el tamaño de una casa que com- 
praría un cliente (en pies cuadrados) y otras variables. Las posibles variables independientes son 
el ingreso familiar, el número de miembros en la familia, si hay un adulto mayor viviendo con la 
familia (1 para sí, 0 para no), y los años totales de educación adicionales al bachillerato del espo- 
so y la esposa. La información muestral se reporta en la siguiente tabla. m 


Familia 

Pies 

cuadrados 

Ingreso (en miles 
de dólares) 

Miembros 
en la familia 

Padre 

adulto 

Educación 

1 

2 240 

60.8 

2 

0 

4 

2 

2 380 

68.4 

2 

1 

6 

3 

3 640 

104.5 

3 

0 

7 

4 

3 360 

89.3 

4 

1 

0 

5 

3 080 

72.2 

4 

0 

2 

6 

2 940 

114 

3 

1 

10 

7 

4 480 

125.4 

6 

0 

6 

8 

2 520 

83.6 

3 

0 

8 

9 

4 200 

133 

5 

0 

2 

10 

2 800 

95 

3 

0 

6 


Formule una ecuación de regresión múltiple apropiada. ¿Qué variables independientes incluiría en 
la ecuación de regresión final? Utilice el método por pasos. 


14.9 Repaso de la regresión múltiple 

En este capítulo hemos descrito varios temas que involucran a la regresión múltiple. En esta 
sección nos enfocaremos en un solo ejemplo con una solución que repasa el procedimiento y 
le guiará en su aplicación del análisis de regresión múltiple. 


Cjemplo 


Solución 


El Banco de Nueva Inglaterra es una gran institución financiera que da servicio a los estados 
de Nueva Inglaterra, así como a Nueva York y Nueva Jersey. El departamento de préstamos 
hipotecarios del banco está estudiando datos de préstamos recientes. Le interesa particular- 
mente a qué grado factores tales como el valor de la casa que se desea comprar (en miles de 
dólares), el nivel de educación del cabeza de familia (número de años, comenzando por el pri- 
mer grado), su edad, el pago mensual actual de la hipoteca (en dólares), y el género de dicha 
persona (hombre = 1, mujer = 0) se relacionan con el ingreso familiar. El departamento de 
préstamos hipotecarios desearía saber si estas variables son predictores eficaces del ingreso 
familiar. 

Para comenzar, considere una muestra aleatoria de 25 solicitudes de crédito sometidas al 
Banco de Nueva Inglaterra el mes pasado. Una parte de dicha información muestral se presen- 
ta en la tabla 14-3. El conjunto completo de datos está disponible en el sitio web (www.mhhe. 
com/lind15e), y se identifica como Banco de Nueva Inglaterra. 

En seguida, desarrollaremos una matriz de correlación que mostrará la relación entre las 
variables independientes y la variable dependiente. Esto ayudará a identificar las variables inde- 
pendientes que se relacionan más con la variable dependiente (ingreso familiar). La matriz de 
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TABLA 14-3 Información de la muestra de 25 préstamos del Banco de Nueva Inglaterra 


Ingreso (miles 
Préstamo de dólares) 

Valor (miles 
de dólares) 

Educación 

Edad 

Hipoteca 

Género 

1 

100.7 

190 

14 

53 

230 

1 

2 

99.0 

121 

15 

49 

370 

1 

3 

102.0 

161 

14 

44 

397 

1 

23 

102.3 

163 

14 

46 

142 

1 

24 

100.2 

150 

15 

50 

343 

0 

25 

96.3 

139 

14 

45 

373 

0 


correlación revelará también aquellas variables Independientes que están altamente relaciona- 
das y que son posiblemente redundantes. La matriz de correlación se muestra a continuación: 



Ingreso (miles 
de dólares) 

Valor (miles 
de dólares 

Educación 

Edad 

Hipoteca 

Género 

Ingreso (miles 







de dólares) 

1.0000 






Valor (miles 







de dólares) 

0.7197 

1.0000 





Educación 

0.1880 

-0.1437 

1.0000 




Edad 

0.2426 

0.2195 

0.6209 

1 .0000 



Hipoteca 

0.1157 

0.3579 

-0.2103 

-0.0379 

1.0000 


Género 

0.4856 

0.1841 

0.0619 

0.1558 

-0.1290 

1.0000 


¿Qué nos revela esta matriz de correlación? 

1 . El ingreso familiar está fuertemente relacionado con el valor de la casa. Existe también una 
correlación moderada entre el género de la persona que solicita el crédito y el ingreso fami- 
liar. Estas dos correlaciones están resaltadas en amarillo en la matriz de correlación. 

2. El monto de la hipoteca tiene una correlación débil con el ingreso familiar. Esta correlación 
se identifica en rojo. 

3. Todas las posibles correlaciones entre las variables independientes están resaltadas en 
letras azules. Nuestro estándar es buscar correlaciones que excedan un valor absoluto de 
0.700. Ninguna de las variables independientes está fuertemente correlacionada con las 
demás. Esto indica que no hay probabilidad de multicolinealidad. 


Después, calculamos la ecuación de la regresión múltiple utilizando todas las variables 
independientes. A continuación se muestra la captura de pantalla. 

• □ 
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0«M 

1 
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25 
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11 

*t 

ss 

WJ 

f 
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11*54 
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11 

15 
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*•¥04* 


17 to**t«* 

70 4041 

74644 

54591 

0 0000 


u v<*j«i5eooi 

C.Ú71 1 
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OOOW 
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0 622* 

25007 
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Los coeficientes de determinación, esto es, R 2 y R 2 ajustado, se reportan en la parte de 
arriba del resumen de la captura de pantalla y están resaltadas en amarillo. El valor R 2 es de 
75.0%, así que las cinco variables independientes representan tres cuartos de la variación del 
Ingreso familiar. El R 2 ajustado mide la fuerza de la relación entre el grupo de variables inde- 
pendientes y el ingreso familiar, y representa también el número de variables en la ecuación de 
regresión. El R 2 ajustado indica que las cinco variables representan 68.4% de la varianza del 
ingreso familiar. Estos dos factores sugieren que las variables independientes propuestas son 
útiles para pronosticar el ingreso familiar. 

La captura de pantalla incluye también la ecuación de regresión: 

Y = 70.61 + .07 (Valor) + 1.62 {Educación) - 0A2(Edad) 

— .001 (Hipoteca) + 1.807 (Género) 

Hay que tener cuidado con esta interpretación. Tanto el ingreso como el valor de la casa están 
en miles de dólares. He aquí un resumen: 

1 . Un aumento de 1 000 dólares del valor de la casa sugiere un incremento de 70 dólares en 
el ingreso familiar. Un aumento de un año de educación eleva el ingreso en 1 620 dólares, 
y un año más de edad reduce el ingreso en 120 dólares, y un incremento de 1 000 dóla- 
res de la hipoteca reduce el ingreso en un dólar. 

2. Si un hombre es el cabeza de familia, el valor del ingreso familiar se elevará en 1 807 dóla- 
res. Recuerde que “mujer” fue codificado como 0, y “hombre” como 1, así que un hombre 
como cabeza de familia está relacionado positivamente con el valor de la casa. 

3. La edad de la cabeza de familia y el pago mensual de la hipoteca están inversamente rela- 
cionados con el ingreso familiar. Esto es cierto porque el signo del coeficiente de regresión 
es negativo. 

A continuación realizamos la prueba de la hipótesis global. Aquí verificamos si cualquiera 
de los coeficientes de regresión es distinto de 0. Aplicamos un nivel de significancia de 0.05. 

Ho- Pi = p2 = p3 = P 4 = Ps = 0 
H a : No todos los (3 son 0. 

El valor p de la tabla (celda F12) es 0.000. Como el valor p es menor al nivel de significancia, 
rechazamos la hipótesis nula y concluimos que cuando menos uno de los coeficientes de 
regresión no es igual a cero. 

En seguida evaluamos los coeficientes individuales de regresión. Consulte los valores p de 
la captura de pantalla para probar cada coeficiente de regresión. Están reportados en las cel- 
das El 8 a E22. Las hipótesis nula y alternativa son: 

H 0 : P, = 0 
HvP,* 0 

El subíndice / representa cualquier variable dependiente particular. Utilizando otra vez los nive- 
les de significancia 0.05, los valores p de los coeficientes de regresión del valor de la casa, años 
de educación y género son menores a 0.05. Concluimos que estos coeficientes de regresión 
no son iguales a 0 y son factores de predicción significativos del ingreso familiar. En el caso de 
edad y monto de la hipoteca, los valores p son mayores al nivel de significancia 0.05, así que 
no rechazamos la hipótesis nula. Los coeficientes de regresión de estas dos variables no difie- 
ren de cero y no están relacionados con el ingreso familiar. 

Basándonos en los resultados de la prueba de cada uno de los coeficientes de regresión, 
concluimos que las variables edad e hipoteca no son factores de predicción eficaces del ingre- 
so familiar. Por lo tanto, deben ser retirados de la ecuación de regresión múltiple. Recuerde que 
debemos retirar una variable independiente a la vez y rehacer el análisis para evaluar el efecto 
general de quitar dicha variable. Nuestra estrategia es retirar la variable que tenga el menor 
estadístico t o el mayor valor p. Esta variable es el monto de la hipoteca. A continuación se pre- 
senta el resultado del análisis de regresión sin la variable hipoteca: 
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A 

B 

C 

D 

E 

F 

1 SUMMAW OUTÍ’yT 

2 

3 fitQ'tStOfí ítOWKS 

4 Mu I* i pie A 

0.865 





5 R Vquaro 
ti Adjutted R Souro 

7 Standard Erro* 

0748 

0698 





L4M 





S Ob«»rv»tlon« 

25 





9 

10 ANOVA 

11 

ai 

;í 

Mi 

r 

P-YOfut 

12 R«gr«(flon 

4 

124.0992 

31.0248 

14.8743 

0 0000 

13 RMlduAl 

20 

41.7159 

20858 



1« Total 

24 

165.6151 




15 






16 

CotffkWnti 

Standard Srrof 

rifar 

P-voJu* 


17 inte«*pt 

70.1594 

7.165* 

9.7915 

0 00N 


15 V*U« 15000) 

0.070J 

0.0114 

«1714 

0.0000 


19 Educatlon 

1 6*66 

0.585* 

28130 

0.0107 


20 AJ* 

■01224 

0.0764 

1-6025 

0.1247 


21 G«ntí«r 

1.8*64 

0.5364 

3.0959 

0.0057 



Observe que R 2 y el R 2 ajustado cambian muy poco sin la variable hipoteca. Note también 
que el valor p asociado con la edad es mayor que el nivel de significancia 0.05. Así que retira- 
mos la variable edad y rehacemos el análisis. A continuación se presenta la captura de panta- 
lla de la regresión sin las variables edad e hipoteca: 


A 

8 

C 

O 

E 

F 

1 5UMMARV OUTPUT 

7 

1 Dtgrtuoa StattWCf 

4 Múltiple R 

5 Riquat* 

6 Ad¡u«*dR5quara 

7 Standard Error 

0 846 

0.718 

0.876 

1497 





8 Otearvatieni 

9 

10 ANOVA 

25 





11 

<¡1 

» 


9 

P-voM* 

12 ftafrciMon 

i 

118.7*29 

33.5810 

17.6580 

0 0000 

11 ftatldual 

21 

47.0722 

2.2415 



14 Total 

24 

165.8151 




15 






16 


írofuforo Erro* 

r •'*.?> 

P- voA/e 


17 lftta*C4pt 

74.5271 

68694 

10.8488 

0.0000 


18 V«lu«(SOOO| 

0.063* 

0.0109 

5.8032 

0.0000 


19 Educaron 

1.0158 

0.4492 

2.2617 

Ú.C3A4 


2 C Ganda* 

1.7697 

06163 

2.8716 

0.0091 



De esta captura de pantalla concluimos: 

1. Los valores R 2 y R 2 ajustado han disminuido, pero sólo ligeramente. Utilizando las cinco 
variables independientes, el valor R 2 fue de 0.750. Al quitar las dos variables no significa- 
tivas, los valores R 2 y R 2 ajustado son 0.716 y 0.676 respectivamente. Preferimos tener la 
ecuación con el menor número de variables independientes, porque es más fácil de inter- 
pretar. 

2. En la tabla ANOVA, observamos que el valor p es menos a 0.05. Por lo tanto, al menos uno 
de los coeficientes de regresión no es igual a cero. 
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3. Revisando la significancia de los coeficientes individuales, comprobamos que los valores 
p asociados con cada una de las variables independientes restantes son menores a 0.05. 
Concluimos que todos los coeficientes de regresión son distintos a cero. Cada variable 
independiente es un factor de predicción útil del ingreso familiar. 

Nuestro paso final es examinar las suposiciones de regresión, enumeradas en la sección 
14-5, a partir de la página 531 , con nuestro modelo de regresión. La primera suposición es que 
existe una relación lineal entre cada variable independiente y la variable dependiente. No es 
necesario revisar la variable ficticia género porque hay sólo dos posibles resultados. A conti- 
nuación se muestran los diagramas de dispersión del ingreso familiar versus el valor de la casa, 
y el ingreso familiar versus los años de educación. 
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El diagrama de dispersión del ingreso contra el valor de la casa muestra una tendencia 
general ascendente. A medida que aumenta el valor de la casa, se eleva también el ingreso 
familiar. Los puntos parecen ser lineales, esto es, no hay un patrón no lineal observable en los 
datos. El diagrama de dispersión de la derecha, del ingreso contra los años de educación, 
muestra que los datos se miden hasta el año próximo pasado. La medida asociada a dicho 
año, es una variable discreta. Dado el método de medición, es difícil hacer una observación en 
el sentido de que la relación es lineal. 

Un trazo de los residuos es útjl también para evaluar la suposición general de linealidad. 
Recuerde que un residuo es (Y - Y) la diferencia entre el valor real de la variable dependiente 
(Y) y el valor pronosticado de la variable independiente (/). Asumiendo que existe una relación 
lineal, la distribución de los residuos debería mostrar una proporción aproximadamente igual 
de los residuos negativos (puntos por encima de la línea) y los positivos (puntos debajo de la 
línea) centrados en cero. No debería haber un patrón observable entre los puntos. El diagrama 
es así: 



No hay un patrón discernible en el trazo, de modo que concluimos que la suposición de linea- 
lidad es razonable. 

Si esta suposición de linealidad es válida, entonces la distribución de residuos debe seguir 
una distribución de probabilidad normal con una media de cero. Para evaluar esta suposición, 
utilizaremos un histograma y un trazo de probabilidad normal. 
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En general, el histograma de la izquierda muestra las mayores características de una dis- 
tribución normal, esto es, la mayoría de las observaciones están en el medio y centradas en la 
media de cero, con menores frecuencias en las colas de la distribución. El trazo de probabili- 
dad normal a la derecha se basa en una distribución de probabilidad normal acumulada. La 
línea azul muestra la distribución normal acumulada estandarizada. Los puntos rojos muestran 
la distribución acumulada de los residuos. Para confirmar la distribución normal de los resi- 
duos, los puntos rojos deben estar próximos a la línea azul. Esto es cierto para la mayoría del 
trazo. Sin embargo, observe que hay capturas de pantalla e incluso quizás un patrón no lineal 
entre los residuos de la parte baja de la gráfica. Como antes, estamos buscando series obte- 
nidas de la linealidad, que no están indicadas en estas gráficas. 

La suposición final se refiere a la multicolinealidad. Esto significa que las variables inde- 
pendientes no deben estar altamente correlacionadas. Sugerimos la regla de oro de que la 
multicolinealidad debe generar preocupación si las correlaciones entre las variables indepen- 
dientes están próximas a 0.7 o -0.7. No hay violaciones a este lineamiento. 

Existe una prueba estadística más precisa para evaluar la multicolinealidad, el factor de 
inflación de la varianza (VIF). A continuación utilizamos Minitab para calcular los VIF. El están- 
dar es que el VIF debe ser menor a 10. Note que todos los VIF son claramente menores a 10, 
así que la multicolinealidad no debe preocuparnos. 


La ecuación de la regresión es 

Ingreso (miles de dólares) = 74.5 + 0.0634 Valor (miles de dólares) 
+ 1.02 Educación + 1.77 Género 


Factor de 


predicción 

Coef 

SE Coef 

T 

P 

VIF 

Constante 

74.527 

6 . 870 

10 . 85 

0 . 000 


Valor ($000) 

0 . 06336 

0 . 01092 

5 .80 

0 . 000 

1 . 062 

Educación 

1 . 0158 

0.4492 

2.26 

0 . 034 

1.030 

Género 

1 . 7697 

0 . 6163 

2.87 

0 . 009 

1 . 044 


Para resumir, la ecuación de la regresión múltiple es 

Y = 74.527 + .0634 (Valor) + 1 .0158(Educac/ón) + 1.7697 (Género) 

Esta ecuación explica 71.6% de la variación del ingreso familiar. No hay partidas principales 
de las suposiciones de linealidad de la regresión múltiple, residuos normalmente distribuidos 
y multicolinealidad. 


Resumen del capítulo 

I. La fórmula general de una ecuación de regresión múltiple es: 

Y = a + b^X-i + b 2 X 2 + ■ ■ ■ + b k X k ( 14 - 1 ) 

donde a es la intersección con el eje Y cuando todas las X son cero, b¡ se refiere a los coeficientes 
de regresión de la muestra, y X¡ al valor de las diversas variables independientes. 
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A. Puede haber cualquier número de variables independientes. 

B. Se emplea el criterio de mínimos cuadrados para desarrollar la ecuación de regresión. 

C. Es necesario un paquete de software estadístico para realizar los cálculos. 

II. Una tabla ANOVA resume el análisis de regresión múltiple. 

A. Reporta la cantidad total de la variación de la variable independiente y divide esta variación entre 
las que se explican mediante el grupo de variables independientes y las que no. 

B. Reporta los grados de libertad asociados con las variables independientes, el error de la varia- 
ción y la variación total. 

III. Hay dos medidas de la eficacia de la ecuación de regresión. 

A. El error estándar de estimación múltiple es similar a la desviación estándar. 

1. Se mide en las mismas unidades que la variable dependiente. 

2. Se basa en desviaciones cuadráticas de la ecuación de regresión. 

3. Varía de 0 a más infinito. 

4. Se calcula a partir de la siguiente ecuación. 

Sy - 123 -* = \ln-(k + \) (14 ' 2) 

B. El coeficiente de determinación múltiple reporta el porcentaje de la variación de la variable 
dependiente que explica el conjunto de variables independientes. 

1 . Puede variar de 0 a 1 . 

2. También se basa en desviaciones cuadráticas de la ecuación de regresión. 

3. Se determina mediante la siguiente ecuación. 


SSR 
SS total 


(14-3) 


4. Cuando el número de variables independientes es grande, se ajusta el coeficiente de deter- 
minación de los grados de libertad como sigue. 


SSE 


ñadj = 1 


n — (k + 1) 
SS total 
n - 1 


(14-4) 


IV. Se utiliza una prueba global para investigar si alguna de las variables independientes tiene coefi- 
cientes de regresión significativos. 

A. La hipótesis nula es: todos los coeficientes de regresión son cero. 

B. La hipótesis alternativa es: al menos un coeficiente de regresión no es cero. 

C. El estadístico de prueba es la distribución F con k (el número de variables independientes), gra- 
dos de libertad en el numerador y n — (k + 1), grados de libertad en el denominador, donde n 
es el tamaño muestral. 

D. La fórmula para calcular el valor del estadístico de prueba de la prueba global es: 


SSR/k 

SSE/[n - (k + 1)] 


(14-5) 


V. La prueba de las variables individuales determina cuáles de ellas tienen coeficientes de regresión 
distintos de cero. 

A. En general, las variables con coeficientes de regresión cero se omiten del análisis. 

B. El estadístico de prueba es la distribución t con n - (k + 1) grados de libertad. 

C. La fórmula para calcular el valor del estadístico de prueba de la prueba individual es: 


f = 


b¡ - 0 

s b , 


(14-6) 


VI. Hay cinco suposiciones para emplear el análisis de regresión. 

A. La relación entre la variable dependiente y el conjunto de variables independientes debe ser li- 
neal. 

1. Para verificar esta suposición se elabora un diagrama de dispersión, y se trazan los residuos 
en el eje vertical y los valores ajustados en el eje horizontal. 

2. Si las gráficas parecen aleatorias, se concluye que la relación es lineal. 

B. La variación es la misma tanto para valores grandes como pequeños de Y. 

1. Homoscedasticidad significa que la variación de todos los valores de la variable dependien- 
te es la misma. 
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2. Esta condición se verifica al elaborar un diagrama de dispersión con los residuos en el eje ver- 
tical y los valores ajustados en el eje horizontal. 

3. Si no hay un patrón en ias gráficas, es decir, si parecen aleatorias, los residuos cumplen con 
el requisito de homoscedasticidad. 

C. Los residuos siguen la distribución de probabilidad normal. 

1. Esta condición se verifica al desarrollar un histograma de los residuos para ver si siguen una 
distribución normal. 

2. La media de la distribución de los residuos es 0. 

D. Las variables independientes no están correlacionadas. 

1. Una matriz de correlación muestra todas las correlaciones posibles entre variables indepen- 
dientes. Son señales de que hay un problema si las correlaciones mayores que 0.70 o bien 
menores que -0.70. 

2. Entre las señales de variables independientes correlacionadas se encuentran los casos cuan- 
do una variable de predicción se determina insignificante, cuando se presenta una inversión 
obvia de signos en una o más de las variables independientes, o bien cuando, al eliminar una 
variable de la solución, se produce un gran cambio en los coeficientes de regresión. 

3. El factor de inflación de la varianza se emplea para identificar variables independientes corre- 
lacionadas. 


WF - vht f |14 ' 71 

E. Cada residuo es independiente de otros residuos. 

1. La autocorrelación ocurre cuando se correlacionan residuos sucesivos. 

2. Cuando existe autocorrelación, el valor del error estándar está sesgado y genera resultados 
deficientes en las pruebas de hipótesis, sin que importen los coeficientes de regresión. 

Vil. Varias técnicas ayudan a elaborar un modelo de regresión. 

A. Una variable independiente ficticia o cualitativa puede asumir uno de dos resultados posibles. 

1. Se asigna un valor de 1 a uno de los resultados y 0 al otro. 

2. Se utiliza la fórmula (14-6) para determinar si la variable ficticia debe permanecer en la ecua- 
ción. 

B. Una interacción se produce cuando una variable independiente (como X 2 ) afecta la relación con 
otra variable independiente (X-,) y la variable dependiente (Y). 

C. La regresión por pasos es un proceso paso por paso para encontrar la ecuación de regresión. 

1. Sólo las variables independientes con coeficientes de regresión distintos de cero entran en la 
ecuación. 

2. Se agregan variables independientes una a la vez a la ecuación de regresión. 


Clave de pronunciación 

SÍMBOLO SIGNIFICADO 

b-i Coeficiente de regresión 

de la primera variable independiente 
b k Coeficiente de regresión de cualquier 

variable independiente 

s Y.i 23 .../t Error estándar de estimación múltiple 


PRONUNCIACIÓN 

b subíndice 1 

b subíndice k 

s subíndice Y punto 7, 2, 3 ... k 


comed: 


Ejercicios del copítulo 

13. Una ecuación de regresión múltiple produce los siguientes resultados parciales. 


Fuente 

Suma de cuadrados 

gi 

Regresión 

750 

4 

Error 

500 

35 


a) ¿Cuál es el tamaño total de la muestra? 

b) ¿Cuántas variables independientes se consideraron? 

c) Calcule el coeficiente de determinación. 

d) Calcule el error estándar de estimación. 

e) Pruebe la hipótesis de que ninguno de los coeficientes de regresión es igual a cero. Suponga 
que a = 0.05. 
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14. En una ecuación de regresión múltiple se consideran dos variables independientes, y el tamaño de 
la muestra es 25. Los coeficientes de regresión y ios errores estándares son los siguientes. 

b 1 = 2.676 s bl = 0.56 

b 2 = -0.880 s b¡ = 0.71 

Realice una prueba de hipótesis para determinar si alguna variable independiente tiene un coefi- 
ciente igual a cero. ¿Consideraría eliminar alguna variable de la ecuación de regresión? Utilice el 

nivel de significancia 0.05. 

15 . Se obtuvo el siguiente resultado. 


Análisis de 

la 

varianza 


FUENTE 


DF 

SS 

MS 

Regresión 


5 

100 

20 

Error 


20 

40 

2 

Total 


25 

140 


Factor de 


Desviación 


predicción 

Coef 

estándar 

Razón t 

Constante 

3 

00 

1 . 50 

2 . 00 


4 

00 

3 . 00 

1.33 

*2 

3 

00 

0.20 

15.00 

*3 

0 

.20 

0 . 05 

O 

o 


-2 

50 

1 . 00 

— 2 . 50 

*5 

3 

00 

4 . 00 

0 . 75 


a) ¿Cuál es el tamaño de la muestra? 
ib) Calcule el valor de R 2 . 

c) Calcule el error estándar de estimación múltiple. 

d) Realice una prueba global de hipótesis para determinar si algunos de los coeficientes de regre- 
sión son significativos. Utilice el nivel de significancia 0.05. 

e) Pruebe los coeficientes de regresión de manera individual. ¿Consideraría omitir alguna(s) varia- 
ble(s)? De ser así, ¿cuál o cuáles? Utilice el nivel de significancia 0.05. 

16 . En una ecuación de regresión múltiple k = 5 y n = 20, el valor de MSE es 5.10, y SS total es 
51 9.68. Con un nivel de significancia 0.05, ¿se puede concluir que alguno(s) de los coeficientes de 
regresión no son iguales a 0? 

17. La gerente de distrito de Jasons, una cadena grande de productos electrónicos, investiga por qué 
ciertas tiendas de su región tienen mejor rendimiento que otras. La gerente considera que los tres 
factores se relacionan con las ventas totales: el número de tiendas de la competencia, la pobla- 
ción del área circundante y ia cantidad que cada una gasta en publicidad. De su distrito, que con- 
siste en varios cientos de tiendas, selecciona una muestra aleatoria de 30 tiendas. Por cada tienda 
reunió la siguiente información. 

Y = ventas totales el año pasado (en miles de dólares) 

X-, = número de tiendas de la competencia en la región. 

X 2 = población de la región (en millones). 

X 3 = gastos en publicidad (en miles de dólares). 

Los datos muéstrales se corrieron en Minitab, con los siguientes resultados. 


Análisis de 

la varianza 


FUENTE 

DF 

SS 

MS 

Regresión 

3 

3050 . 00 

1016 . 67 

Error 

26 

2200 . 00 

84 . 62 

Total 

29 

5250 . 00 


Factor de 

Desviación 


predicción 

Coef 

estándar 

Razón t 

Constante 

14 . 00 

7 . 00 

2 . 00 


o 

0 

rH 

1 

0.70 

-1.43 

*2 

30 . 00 

5.20 

5 . 77 

*3 

0.20 

0 . 08 

2 . 50 


Ejercicios del capítulo 


555 


a) ¿Cuáles son las ventas estimadas de la tienda Byrne, que tiene cuatro competidores, una 
población regional de 0.4 (400 000) y gastos en publicidad de 30 ($30 000)? 

¿>) Calcule el valor de R 2 . 

c) Calcule el error de estimación estándar múltiple. 

d) Realice una prueba de hipótesis global para determinar si alguno(s) de los coeficientes de 
regresión no son iguales a cero. Utilice el nivel de significancia 0.05. 

e) Realice pruebas de hipótesis para determinar cuál o cuáles de las variables independientes tie- 
nen coeficientes de regresión significativos. ¿Qué variables consideraría eliminar? Utilice el 
nivel de significancia 0.05. 

18. Suponga que el gerente de ventas de un distribuidor grande de partes de autos desea estimar en 
el mes de abril las ventas totales anuales de una región. Con base en las ventas regionales, tam- 
bién se pueden estimar las ventas totales de la compañía. Con base en la experiencia pasada, se 
determina que las estimaciones de abril de las ventas anuales tienen una precisión razonable, en 
años futuros esa predicción serviría para revisar los programas de producción y mantener el inven- 
tario correcto en las tiendas de descuento minoristas. 

Parece que varios factores están relacionados con las ventas, como el número de tiendas de 
descuento minoristas en la región que venden componentes de la compañía, el número de auto- 
móviles en la región registrados desde el 1 de abril, y el ingreso total personal del primer trimestre 
del año. Al final se seleccionaron cinco variables independientes como las más importantes (según 
el gerente de ventas). Luego se recopilaron los datos de un año reciente. También se registraron 
las ventas totales anuales en ese año por cada región. En la siguiente tabla observe que en la 
región 1 había 1 739 tiendas de descuento minoristas que vendían los componentes de autos de 
la compañía y 9 270 000 automóviles registrados en la región desde el 1 de abril. Las ventas en 
ese año fueron $37 702 000. 


Ventas 
anuales 
(millones 
de dólares), 

Y 

Número 
de tiendas 
de 

descuento, 

Número de 
automóviles 
registrados 
(millones), 

X 2 

Ingreso 

personal (miles 
de millones 
de dólares), 

*3 

Antigüedad 
promedio de 
los automóviles 
(años), 

*4 

Número 

de 

supervisores, 

x 5 

37.702 

1 739 

9.27 

85.4 

3.5 

9.0 

24.196 

1 221 

5.86 

60.7 

5.0 

5.0 

32.055 

1 846 

8.81 

68.1 

4.4 

7.0 

3.611 

120 

3.81 

20.2 

4.0 

5.0 

17.625 

1 096 

10.31 

33.8 

3.5 

7.0 

45.919 

2 290 

11.62 

95.1 

4.1 

13.0 

29.600 

1 687 

8.96 

69.3 

4.1 

15.0 

8.114 

241 

6.28 

16.3 

5.9 

11.0 

20.116 

649 

7.77 

34.9 

5.5 

16.0 

12.994 

1 427 

10.92 

15.1 

4.1 

10.0 


a) Considere la siguiente matriz de correlación. ¿Qué variable individual tiene la correlación más 
fuerte con la variable dependiente? Las correlaciones entre las variables independientes, tien- 
das de descuento e ingreso, y entre automóviles y tiendas de descuento, son muy fuertes. 
¿Esto puede representar un problema? ¿Cómo se denomina esta condición? 



ventas 

tiendas de 
descuento 

automóviles 

ingreso 

antigüedad 

tiendas de 

descuento 

automóviles 

ingreso 

antigüedad 

0 .899 

0 .605 

0 . 964 

-0.323 

0 . 775 

0 . 825 

-0.489 

0.409 

-0.447 

-0.349 


supervisores 

0.286 

0 . 183 

0.395 

0 . 155 

0.291 


b) En la siguiente tabla se presenta el resultado de la ecuación de regresión de las cinco variables. 
¿Qué porcentaje de la variación se explica mediante la ecuación de regresión? 
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La ecuación de regresión 

es 




Ventas = 

-19.7 - 0.00063 

tiendas 

de descuento 

+ 1.74 

automóviles + 


0.410 ingreso + 

2.04 antigüedad — 0. 

034 supervisores 


Factor de 


Desviación 




predicción 

Coef 

estándar 

Razón t 

P 


Constante 

-19 . 672 

5.422 

-3 . 63 

0 . 022 


tiendas de 






descuento — 0 

. 000629 

0 . 002638 

-0.24 

0 . 823 


automóviles 

1 . 7399 

0.5530 

3 . 15 

0 . 035 


ingreso 

0.40994 

0 . 04385 

9 . 35 

0 . 001 


antigüedad 

2 . 0357 

0 . 8779 

2 . 32 

0 . 081 


supervisores 

-0 . 0344 

0.1880 

-0.18 

0 . 864 

Análisis 

de la varianza 






FUENTE 

GL 

SS MS 

F 

P 


Regresión 

5 1593.81 318.76 

140.36 

0 . 000 


Residual Error 

4 

9.08 2.27 




Total 

9 1602.89 




c) Realice una prueba global de hipótesis para determinar si alguno(s) de los coeficientes de 
regresión no son cero. Utilice el nivel de significancia 0.05. 

d) Realice una prueba de hipótesis en cada una de las variables independientes. ¿Consideraría 
eliminar “tiendas de descuento” y “supervisores”? Utilice el nivel de significancia 0.05. 

e) Se vuelve a correr la regresión, pero ahora sin “tiendas de descuento” y “supervisores”, como 
se muestra a continuación. Calcule el coeficiente de determinación. ¿Cuánto cambió R 2 a par- 
tir del análisis anterior? 


La ecuación de regresión 

es 





Ventas = 

-18.9 + 1.61 

automóviles + 0.400 

ingreso + 1 

96 antigüedad 


Factor de 


Desviación 





predicción 

Coef 

estándar 

Razón t 

P 


Constante 

-18 . 924 

3 . 636 


-5.20 

0 . 002 


automóviles 

1 . 6129 

0 . 1979 


8.15 

0 . 000 


ingreso 

0.40031 

0 . 01569 


25.52 

0 . 000 


antigüedad 

1 . 9637 

0 . 5846 


3 . 36 

0 . 015 

Análisis 

de la varianza 







FUENTE 

GL 

SS 

MS 

F 

P 


Regresión 

3 

1593.66 531 

22 

345 . 25 

0 . 000 


Residual Error 

6 

9.23 1 

54 




Total 

9 

1602 . 89 





f) A continuación se presenta un histograma y un diagrama de tallo y hojas de los residuos. 
¿Parece razonable la suposición de normalidad? 


Histograma 

de 

los residuos 

N = 10 

Diagrama de tallo y hojas 





de 

residuos N = 10 





Unidad de hoja = 0.10 

Punto 






medio Conteo 





-1 . 5 

1 

* 

1 

-1 

7 

-1 . 0 

1 

* 

2 

-1 

2 

-0.5 

2 

* * 

2 

-0 


-o . 0 

2 

* * 

5 

-o 

440 

0.5 

2 

* * 

5 

0 

24 

1 . 0 

1 

* 

3 

0 

68 

1 . 5 

1 

* 

1 

1 





1 

1 

7 


g) La siguiente es una gráfica de los valores ajustados de Y (es decir, Y) y de los residuos. 
¿Observa alguna violación de las suposiciones? 
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Valores ajustados 


19. El administrador de un nuevo programa para practicantes de leyes en Seagate Technical College 
desea estimar el promedio de calificaciones en el programa, y considera que el promedio de cali- 
ficaciones en el bachillerato, la calificación en aptitudes verbales en el Examen de Aptitud Escolar 
(SAT) y la calificación en matemáticas en el SAT serían buenos factores de predicción de la califi- 
cación promedio en el programa. Los datos de nueve estudiantes son: 


Estudiante 

Promedio de 
calificaciones 
en el bachillerato 

SAT 

Verbal 

SAT 

matemáticas 

Promedio de 
calificaciones 
en el programa 

1 

3.25 

480 

410 

3.21 

2 

1.80 

290 

270 

1.68 

3 

2.89 

420 

410 

3.58 

4 

3.81 

500 

600 

3.92 

5 

3.13 

500 

490 

3.00 

6 

2.81 

430 

460 

2.82 

7 

2.20 

320 

490 

1.65 

8 

2.14 

530 

480 

2.30 

9 

2.63 

469 

440 

2.33 


a) Considere la siguiente matriz de correlación. ¿Qué variable tiene la correlación más fuerte con 
la variable dependiente? Algunas correlaciones entre las variables independientes son fuertes. 
¿Esto representaría un problema? 



leyes 

gpa 

verbal 

calificación 

0.911 



promedio 

0 . 616 

0 .609 


matemáticas 

0.487 

0 . 636 

0.599 


b) Considere el siguiente resultado. Calcule el coeficiente de determinación múltiple. 


La ecuación 

de 

regresión 

es 



Leyes = —0 

411 

+ 1.20 calificación + 0.00163 verbal 

— 0.00194 matemáticas 

Factor de 



Desviación 



predicción 


Coef 

estándar 

Razón t 

P 

Constante 


-0.4111 

0 . 7823 

-0 . 53 

0.622 

GPA 


1.2014 

0.2955 

4 . 07 

0.010 

Verbal 


0 . 001629 

0 . 002147 

0.76 

0.482 

matemáticas 


-0 . 001939 

0 . 002074 

-0 . 94 

0.393 

Análisis de 

la 

varianza 




Fuente 


GL 

SS MS 

F 

P 

Regresión 


3 

4.3595 1.4532 

10.33 

0 . 014 

Residual Error 

5 

0.7036 0.1407 



Total 


8 

5.0631 



FUENTE 

DF Seq SS 




GPA 


1 4.2061 




Verbal 


1 0.0303 




Matemáticas 


1 0.1231 
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c) Realice una prueba global de hipótesis a partir del resultado anterior. ¿Alguno de los coeficien- 
tes de regresión no es igual a cero? 

d) Realice una prueba de hipótesis de cada variable independiente. ¿Consideraría eliminar las 
variables “verbal” y “matemáticas”? Utilice un nivel a = 0.05. 

e) El análisis se vuelve a correr, pero ahora sin “verbal” y “matemáticas”. Observe la siguiente cap- 
tura de pantalla. Calcule el coeficiente de determinación. ¿Cuánto cambió R 2 a partir del aná- 
lisis anterior? 


La ecuación 

de regresión es 



Leyes = —0 

454 + 1 

16 calificación 



Factor de 


Desviación 



predicción 

Coef 

estándar Razón t 

P 

Constante 

-0.4542 

0.5542 

CN 

co 

o 

0.439 

GPA 

1 . 1589 

0 . 1977 

5 . 86 

0 . 001 

Análisis de 

la varianza 



FUENTE 

GL 

SS MS 

F 

p 

Regresión 

1 

4.2061 4.2061 

34 . 35 

0.001 

Residual Error 7 

0.8570 0.1224 



Total 

8 

5 . 0631 




f) A continuación se presenta un histograma y un diagrama de tallo y hojas de las varianzas resi- 
duales. ¿Parece razonable la suposición de normalidad en el caso de las varianzas residuales? 


Histograma de las varianzas residualesl N = 9 
Punto medio Conteo 


- 

0.4 


1 

* 

- 

0.2 


3 

* * * 


o 

o 


3 

* * * 


0.2 


1 

: k 


0.4 


0 



0.6 


1 

* 

Tallo 

y 

hojas de 

las varianzas residuales N = 9 

Unidad de hojas = 

0 . 10 


1 

-o 

4 



2 

-o 

2 



(3) 

-o 

110 



4 

0 

00 



2 

0 




1 

0 




1 

0 

6 




g) En la siguiente gráfica se presentan los valores de los residuos y los valores de Y. ¿Observa 
alguna violación de las suposiciones? 
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20 . Mike Wilde es el presidente del sindicato de maestros del Otsego School District. A fin de prepa- 
rarse para negociaciones próximas, le gustaría investigar la estructura de los salarios de los maes- 
tros del distrito. Wilde considera que hay tres factores que influyen en el salario de un maestro: sus 
años de experiencia, la calificación de su eficiencia como docente por parte del director y si cuen- 
ta con un posgrado. Una muestra de 20 maestros generó los siguientes datos. 


Salario (miles 
de dólares), 

Y 

Años de 
experiencia, 

X í 

Calificación 
del director, 

X 2 

Posgrado,* 

*3 

31.1 

8 

35 

0 

33.6 

5 

43 

0 

29.3 

2 

51 

1 

30.7 

4 

62 

0 

32.8 

2 

80 

1 

42.8 

8 

72 

0 


*1 = sí, 0 = no. 


a) Formule una matriz de correlación. ¿Qué variable independiente tiene la correlación más fuer- 
te con la variable dependiente? ¿Flabrá problemas respecto de la multicolinealidad? 

b) Determine la ecuación de regresión. ¿Qué salario estimaría para un maestro con cinco años de 
experiencia, una calificación del director de 60 y sin posgrado? 

c) Realice una prueba global de la hipótesis para determinar si alguno de los coeficientes de 
regresión difiere de cero. Utilice el nivel de significancia 0.05. 

d) Realice la prueba de hipótesis de los coeficientes de regresión individuales. ¿Consideraría eli- 
minar alguna de las variables independientes? Utilice el nivel de significancia 0.05. 

e) Si su conclusión en el inciso d) fue eliminar una o más variables independientes, realice de nue- 
vo el análisis sin estas variables. 

f) Determine los residuos de la ecuación del inciso e). Utilice un diagrama de tallo y hojas o bien 
un histograma para verificar que la distribución de los residuos sea aproximadamente normal. 

g) Trace los residuos calculados en el inciso f) en un diagrama de dispersión con las varianzas 
residuales en el eje Y y los valores Y en el eje X. ¿La gráfica revela alguna violación de las supo- 
siciones de regresión? 

21 . Un análisis de consumidor recabó los siguientes datos sobre los tamaños de pantalla de los tele- 
visores más populares vendidos recientemente en una gran tienda minorista: m 


Fabricante 

Pantalla 

Precio 

Fabricante 

Pantalla 

Precio 

Sharp 

46 

$1 473.00 

Sharp 

37 

$1 314.50 

Samsung 

52 

2 300.00 

Sharp 

32 

853.50 

Samsung 

46 

1 790.00 

Sharp 

52 

2 778.00 

Sony 

40 

1 250.00 

Samsung 

40 

1 749.50 

Sharp 

42 

1 546.50 

Sharp 

32 

1 035.00 

Samsung 

46 

1 922.50 

Samsung 

52 

2 950.00 

Samsung 

40 

1 372.00 

Sony 

40 

1 908.50 

Sharp 

37 

1 149.50 

Sony 

52 

3 103.00 

Sharp 

46 

2 000.00 

Sony 

46 

2 606.00 

Sony 

40 

1 444.50 

Sony 

46 

2 861.00 

Sony 

52 

2 615.00 

Sony 

52 

3 434.00 

Samsung 

32 

747.50 
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a) ¿Parece haber una relación lineal entre el tamaño de la pantalla y el precio? 

b) ¿Cuál es la variable “dependiente”? 

c) Utilizando software estadístico, determine la ecuación de regresión. Interprete el valor de la 
pendiente en la ecuación de regresión. 

d) Incluya al fabricante en un análisis de regresión lineal múltiple empleando una variable “ficticia”. 
¿Parece que algunos fabricantes pueden establecer un precio especial? Sugerencia: Deberá 
usar un grupo de variables indicadoras. 

e) Pruebe cada uno de los coeficientes individuales para ver si son significativos. 

f) Haga un trazo de los residuos y comente si parecen seguir una distribución normal. 

g) Trace los residuos contra los valores ajustados. ¿Parecen tener la misma cantidad de variación? 
22. Una planeadora regional estudia los datos demográficos en un área de un estado en particular. Ha 

recabado los siguientes datos en nueve condados. 


Condado 

Ingreso mediano 

Edad mediana 

Costero 

A 

$48 157 

57.7 

1 

B 

48 568 

60.7 

1 

C 

46 816 

47.9 

1 

D 

34 876 

38.4 

0 

E 

35 478 

42.8 

0 

F 

34 465 

35.4 

0 

G 

35 026 

39.5 

0 

H 

38 599 

65.6 

0 

J 

33 315 

27.0 

0 


a) ¿Existe una relación lineal entre el ingreso mediano y la edad mediana? 

b) ¿Cuál es la variable “dependiente”? 

c) Utilice software estadístico para determinar la ecuación de regresión. Interprete el valor de la 
pendiente en la ecuación de regresión simple. 

d) Incluya el aspecto de que el condado sea “costero” o no en un análisis de regresión lineal múl- 
tiple empleando una variable “ficticia”. ¿Parece haber una influencia significativa de los ingre- 
sos? 

e) Pruebe cada uno de los coeficientes individuales para ver si son significativos. 

f) Haga un trazo de los residuos y comente si parecen seguir una distribución normal. 

g) Trace los residuos contra los valores ajustados. ¿Parecen tener la misma cantidad de variación? 
23. Great Plains Roofing and Siding Company, Inc., vende productos para techos y recubrimientos de 

paredes a minoristas en reparación de casas, como Lowe’s y Home Depot, y a contratistas comer- 
ciales. El propietario desea estudiar los efectos de diversas variables sobre el valor de las tejas 
americanas vendidas (miles de dólares). El gerente de marketing argumenta que la compañía debe 
gastar más dinero en publicidad, en tanto que un investigador de mercado sugiere que se debe 
enfocar más en diferenciar su marca y su producto de sus competidores. 

La compañía dividió a Estados Unidos en 26 distritos de comercialización. En cada distrito reu- 
nió información sobre las siguientes variables: volumen de ventas (en miles de dólares), dólares 
gastados en publicidad, número de cuentas activas, número de marcas de competidores y una 
calificación del potencial del distrito. 


Ventas 
(miles de 
dólares) 

Dólares en 
publicidad 
(miles) 

Número de 
cuentas 

Número de 
competidores 

Potencial 
de mercado 

79.3 

5.5 

31 

10 

8 

200.1 

2.5 

55 

8 

6 

163.2 

8.0 

67 

12 

9 





(continúa) 
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Ventas 
(miles de 
dólares) 

Dólares en 
publicidad 
(miles) 

Número de 
cuentas 

Número de 
competidores 

Potencial 
de mercado 

200.1 

3.0 

50 

7 

16 

146.0 

3.0 

38 

8 

15 

177.7 

2.9 

71 

12 

17 

93.5 

4.2 

26 

8 

3 

259.0 

4.5 

75 

8 

19 

331.2 

5.6 

71 

4 

9 


Realice un análisis de regresión múltiple para encontrar los mejores factores de predicción de las 
ventas. 

a) Trace un diagrama de dispersión donde se compare el volumen de ventas con cada una de las 
variables independientes. Haga un comentario sobre los resultados. 

b) Formule una matriz de correlación. ¿Hay algún problema? ¿Hay alguna variable independiente 
redundante? 

c) Formule una ecuación de regresión. Realice una prueba global. ¿Se puede concluir que algu- 
nas de las variables independientes son útiles para explicar la variación de la variable depen- 
diente? 

d) Realice una prueba con cada una de las variables independientes. ¿Hay alguna que se deba 
eliminar? 

e) Refine la ecuación de regresión de modo que las variables restantes sean significativas. 

f) Elabore un histograma de los residuos y una gráfica de probabilidad normal. ¿Hay algún pro- 
blema? 

g) Determine el factor de inflación de la varianza de cada una de las variables independientes. 
¿Hay algún problema? 

24. El Times-Observer es un periódico de la ciudad Metro. Al igual que muchos periódicos, el Times- 
Observer pasa por dificultades financieras. La gerente de circulación estudia otros periódicos en 
ciudades similares en Estados Unidos y Canadá, con interés particular en las variables que se rela- 
cionan con el número de suscriptores. Ella reúne la siguiente información muestral de 25 periódi- 
cos de ciudades similares. Se emplea la siguiente notación: m 

Sus = Número de suscriptores (en miles). 

Pob = Población metropolitana (en miles). 

Pub = Presupuesto en publicidad del periódico (miles de dólares). 

Ingreso = Ingreso familiar medio en el área metropolitana (miles de dólares). 


Periódico 

Sus 

Pob 

Pub 

Ingreso 

1 

37.95 

588.9 

13.2 

35.1 

2 

37.66 

585.3 

13.2 

34.7 

3 

37.55 

566.3 

19.8 

34.8 

23 

38.83 

629.6 

22.0 

35.3 

24 

38.33 

680.0 

24.2 

34.7 

25 

40.24 

651.2 

33.0 

35.8 


a) Determine la ecuación de regresión. 

b) Realice una prueba global de hipótesis para determinar si algunos de los coeficientes de regre- 
sión no son iguales a cero. 

c) Realice la prueba de los coeficientes individuales. ¿Consideraría eliminar algunos de ellos? 

d) Determine los residuos y trácelos contra los valores ajustados. ¿Hay problemas? 

e) Elabore un histograma de las varianzas residuales. ¿Hay problemas con la suposición de nor- 
malidad? 
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25. Fred G. Hire es el gerente de recursos humanos en Crescent Tool and Die, Inc. Como parte de su 
reporte anual para el presidente, se requiere que presente un análisis de los empleados asalaria- 
dos. Como hay más de 1 000 empleados y no tiene personal para reunir Información sobre cada 
uno de ellos, decide seleccionar una muestra aleatoria de 30. Por cada empleado registra su sala- 
rio mensual, los años de servicio en la compañía, en meses, el género (1 = masculino, 0 = feme- 
nino), y si ocupa un puesto técnico o administrativo. Los puestos técnicos se codifican 1 , y los 
administrativos, 0. ^ 


Empleado 

muestreado 

Salario 

mensual 

Antigüedad en 
la compañía 

Edad 

Género 

Puesto 

1 

$1 769 

93 

42 

1 

0 

2 

1 740 

104 

33 

1 

0 

3 

1 941 

104 

42 

1 

1 

28 

1 791 

131 

56 

0 

1 

29 

2 001 

95 

30 

1 

1 

30 

1 874 

98 

47 

1 

0 


a) Determine la ecuación de regresión; use el salario como variable dependiente y las otras cua- 
tro variables como independientes, 
ib) ¿Cuál es el valor de fí 2 ? Plaga un comentario sobre este valor. 

c) Realice una prueba global de hipótesis para determinar si algunas de las variables independien- 
tes son diferentes de 0. 

d) Realice una prueba individual de hipótesis para determinar si se pueden omitir algunas varia- 
bles independientes. 

e) Determine de nuevo la ecuación de regresión; use sólo las variables independientes que sean 
significativas. ¿Cuánto más gana al mes un hombre que una mujer? ¿Hay alguna diferencia si 
el empleado ocupa un puesto técnico o uno administrativo? 

26. Muchas regiones a lo largo de la costa de Carolina del Norte, de Carolina del Sur y Georgia expe- 
rimentaron un rápido crecimiento poblacional durante los últimos 10 años. Se espera que el desa- 
rrollo continúe durante los próximos 10 años. Esto ha motivado a muchas de las cadenas im- 
portantes de abarrotes a construir nuevas tiendas en la región. La cadena Kelly’s Super Grocery 
Stores, Inc., no es la excepción, y su director de planeación desea estudiar si es conveniente agre- 
gar más tiendas en esta región. El director considera que hay dos factores principales que indican 
la cantidad monetaria que las familias gastan en abarrotes. El primero es su ingreso y el otro es el 
número de personas que las integran. El director reunió la siguiente información muestral. 


Familia 

Alimentos 

Ingreso 

Tamaño 

1 

$5.04 

$ 73.98 

4 

2 

4.08 

54.90 

2 

3 

5.76 

94.14 

4 

23 

4.56 

38.16 

3 

24 

5.40 

43.74 

7 

25 

4.80 

48.42 

5 


Los alimentos y el ingreso se reportan en miles de dólares por año, y la variable tamaño se refiere 
al número de personas en el hogar. 

a) Elabore una matriz de correlación. ¿Detecta algunos problemas con la multicolinealidad? 

b) Determine la ecuación de regresión. Haga un comentario sobre la ecuación de regresión. 
¿Cuánto dinero agrega un miembro familiar adicional a la cantidad que se gasta en alimentos? 

c) ¿Cuál es el valor de fí 2 ? ¿Se puede concluir que este valor es mayor que 0? 

d) ¿Consideraría eliminar algunas de las variables independientes? 

e) Trace los residuos en un histograma. ¿Hay algún problema con la suposición de normalidad? 

f ) Trace los valores ajustados contra los valores de los residuos. ¿Revela esta gráfica problemas 
con la homoscedasticidad? 
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27. Una asesora en inversiones estudia la relación entre un precio accionario común de la razón de 
ganancias (P/E) y los factores que considera que influirían en él, y para esto cuenta con la siguien- 
te información sobre las ganancias por acción (EPS) y el porcentaje de dividendos (rendimiento) 
de una muestra de 20 acciones. 


Acción 

P/E 

EPS 

Rendimiento 

1 

20.79 

$2.46 

1.42 

2 

3.03 

2.69 

4.05 

3 

44.46 

-0.28 

4.16 

18 

30.21 

1.71 

3.07 

19 

32.88 

0.35 

2.21 

20 

15.19 

5.02 

3.50 


a) Determine una ecuación de regresión lineal múltiple con P/E como variable dependiente. 

£>) ¿Son cualquiera de las dos variables independientes un factor eficaz de predicción de P/E? 

c) Interprete los coeficientes de regresión. 

d) ¿Alguna de estas acciones parece estar subvalorada de manera particular? 

e) Trace los residuos y verifique la suposición de normalidad. Trace los valores ajustados contra 
los residuos. 

f ) ¿Parece haber problemas de homoscedasticidad? 

g) Determine una matriz de correlación. ¿Alguna de las correlaciones indica multicolinealidad? 
28. El Conch Café, ubicado en Gulf Shores, Alabama, ofrece almuerzos casuales con una gran vista 

al Golfo de México. Para adaptarse al aumento de la clientela durante la temporada vacacional de 
verano, Fuzzy Conch, el propietario, contrata a un gran número de meseros como ayuda tempo- 
ral. Cuando entrevista a un mesero potencial, a Fuzzy le gustaría contar con información sobre la 
cantidad monetaria en propinas que un mesero puede ganar. Fuzzy considera que la cantidad de 
la cuenta y el número de clientes se relacionan con el monto de la propina, y reunió la siguiente 
información. Tj > 


Cliente 

Monto de 
la propina 

Monto de 
la cuenta 

Número de 
clientes 

1 

$7.00 

$48.97 

5 

2 

4.50 

28.23 

4 

3 

1.00 

10.65 

1 

28 

2.50 

26.25 

2 

29 

9.25 

56.81 

5 

30 

8.25 

50.65 

5 


a) Desarrolle una ecuación de regresión múltiple con la cantidad monetaria en propinas como 
variable dependiente, y la cantidad monetaria de la cuenta y el número de clientes como varia- 
bles independientes. Escriba la ecuación de regresión. ¿Cuánto dinero más agrega otro clien- 
te a la cantidad de las propinas? 

b) Realice una prueba global de hipótesis para determinar si al menos una de las variables inde- 
pendientes es significativa. ¿Cuál es su conclusión? 

c) Realice la prueba individual para cada una de las variables. ¿Se debe eliminar una u otra? 

d) Utilice la ecuación elaborada en el inciso c) para establecer el coeficiente de determinación. 
Interprete su valor. 

e) Trace los valores de los residuos. ¿Es razonable suponer que siguen la distribución normal? 

f) Trace los valores residuales frente a los ajustados. ¿Es razonable concluir que son aleatorios? 
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29. El presidente de Blitz Sales Entreprises, una compañía que vende productos de cocina mediante 
comerciales en televisión, con frecuencia denominados infomerciales, reunió datos de las últimas 
15 semanas de ventas para determinar la relación entre las ventas y el número de infomerciales. 



Infomerciales 

Ventas (miles 
de dólares) 

Infomerciales 

Ventas (miles 
de dólares) 

20 

3.2 

22 

2.5 

15 

2.6 

15 

2.4 

25 

3.4 

25 

3.0 

10 

1.8 

16 

2.7 

18 

2.2 

12 

2.0 

18 

2.4 

20 

2.6 

15 

2.4 

25 

2.8 

12 

1.5 




a) Determine la ecuación de regresión. ¿Es posible predecir las ventas a partir del número de 
comerciales? 

b) Determine los residuos y trace un histograma. ¿Parece razonable la suposición de normalidad? 

30. El director de actos especiales de Sun City consideraba que la cantidad de dinero que se gasta en 

juegos pirotécnicos el 4 de julio (día de la independencia de Estados Unidos) era un factor de pre- 
dicción de la asistencia al Festival de otoño de octubre, por lo que reunió la siguiente información 
para probar su supuesto. 


4 de julio 
(miles de dólares) 

Festival de otoño 
(miles) 

4 de julio 
(miles de dólares) 

Festival de otoño 
(miles) 

10.6 

8.8 

9.0 

9.5 

8.5 

6.4 

10.0 

9.8 

12.5 

10.8 

7.5 

6.6 

9.0 

10.2 

10.0 

10.1 

5.5 

6.0 

6.0 

6.1 

12.0 

11.1 

12.0 

11.3 

8.0 

7.5 

10.5 

8.8 

7.5 

8.4 




Determine la ecuación de regresión. ¿Está relacionada la cantidad que se gasta en juegos pirotéc- 
nicos con la asistencia al Festival de otoño? Realice una prueba de hipótesis para determinar si 
hay algún problema con la autocorrelación. 

31. Usted es un empleado nuevo de Laurel Woods Real State, que se especializa en la venta de casas 
hipotecadas por medio de subastas públicas. Su jefe le pidió aplicar los siguientes datos (saldo de 
la hipoteca, pagos mensuales, pagos hechos antes de la hipoteca y precio final en la subasta) a 
una muestra aleatoria de ventas recientes con el fin de estimar el precio real de la subasta. 


Préstamo 

Pagos 

mensuales 

Pagos 

hechos 

Precio en 
la subasta 

$ 85 600 

$ 985.87 

1 

$16 900 

115 300 

902.56 

33 

75 800 

103 100 

736.28 

6 

43 900 

119 400 

1021.23 

58 

69 000 

90 600 

836.46 

3 

35 600 

104 500 

1056.37 

22 

63 000 


Ejercicios de la base de datos 
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a) Realice la prueba global de hipótesis para verificar si algunos de los coeficientes de regresión 
son diferentes de cero. 

ib) Realice la prueba individual de las variables independientes. ¿Eliminaría alguna variable? 

c) Si parece que una o más de las variables independientes no son necesarias, elimínela y resuel- 
va la nueva ecuación de regresión. 

32 . Considere las cifras del ejercicio anterior. Agregue una variable nueva que describa la interacción 
potencial entre la cantidad del préstamo y el número de pagos hechos. Después haga una prue- 
ba de hipótesis para verificar si la interacción es significativa. 


Ejercicios de lo base de datos 

33 . Consulte los datos de Real State, donde se reporta información sobre casas vendidas en ei área 
de Goodyear, Arizona, durante el año pasado. Utilice el precio de venta de la casa como variable 
dependiente y determine la ecuación de regresión con el número de recámaras, tamaño de la casa, 
si tiene alberca, si tiene garaje, distancia desde el centro de la ciudad, y el número de baños como 
variables independientes. 

a) Escriba la ecuación de regresión. Analice cada una de las variables. Por ejemplo, ¿le sorpren- 
de que el coeficiente de regresión de la distancia desde el centro de la ciudad sea negativo? 
¿Cuánto agrega un garaje o una alberca al precio de una casa? 

b) Determine el valor de la intersección. 

c) Desarrolle una matriz de correlación. ¿Cuáles variables independientes tienen correlaciones 
fuertes o débiles con la variable dependiente? ¿Detecta algunos problemas con la multicolinea- 
lidad? 

d) Realice la prueba global en el conjunto de variables independientes. Interprétela. 

e) Realice la prueba de hipótesis de cada una de las variables independientes. ¿Consideraría eli- 
minar algunas de las variables? Si es así, ¿cuáles? 

f) Efectúe de nuevo el análisis hasta que sólo permanezcan en él coeficientes de regresión signi- 
ficativos. Identifique estas variables. 

g) Elabore un histograma o bien un diagrama de tallo y hojas de los residuos a partir de la ecua- 
ción de regresión final desarrollada en el inciso f). ¿Es razonable concluir que se cumplió la 
suposición de normalidad? 

h) Trace los residuos contra los valores ajustados a partir de la ecuación de regresión final des- 
arrollada en el inciso f) contra los valores ajustados de Y. Trace los residuos en el eje vertical, 
y los valores ajustados, en el eje horizontal. 

34 . Consulte los datos Baseball 2009, donde se reporta información sobre los 30 equipos de la Liga 
Mayor de Béisbol de la temporada 2009. Sea el número de juegos ganados la variable dependien- 
te, y las siguientes variables, las independientes: promedio de bateo del equipo, número de bases 
robadas, número de errores cometidos, promedio de carreras del equipo, número de jonrones, y 
si el equipo juega en la liga Nacional o en la Americana. 

a) Utilice un software estadístico para determinar la ecuación de regresión. Comente sobre cada 
una de las variables. Por ejemplo, ¿le sorprende que el coeficiente de regresión del promedio 
de carreras sea negativo? ¿El número de victorias se ve afectado si el equipo juega en la liga 
Nacional o en la Americana? 

b) Encuentre el coeficiente de determinación de este grupo de variables independientes. 

c) Formule una matriz de correlación. ¿Qué variables independientes tienen correlaciones fuertes 
o débiles con la variable dependiente? ¿Detecta algunos problemas con la multicolinealidad? 

d) Realice una prueba global en el conjunto de variables independientes. Interprétela. 

e) Realice una prueba de hipótesis en cada una de las variables independientes. ¿Consideraría 
eliminar algunas de las variables? Si es así, ¿cuáles? 

f) Vuelva a efectuar el análisis hasta que sólo permanezcan coeficientes de regresión netos sig- 
nificativos. Identifique estas variables. 

g) Elabore un histograma o bien un diagrama de tallo y hojas de los residuos a partir de la ecua- 
ción de regresión final desarrollada en el inciso f). ¿Es razonable concluir que se cumplió la 
suposición de normalidad? 

h) Trace los residuos contra los valores ajustados a partir de la ecuación de regresión final des- 
arrollada en el inciso 1) contra los valores de los valores ajustados de Y. Trace los residuos en 
el eje vertical, y los valores ajustados, en el eje horizontal. 

35 . Consulte los datos de los autobuses escolares del Distrito Escolar Buena. Primero, añada una 
variable para cambiar el tipo de autobús (diesel o gasolina) a una variable cualitativa. Si el tipo de 
autobús es diesel, establezca la variable cualitativa a 0; si es de gasolina, establezca la variable 
cualitativa en 1 . Desarrolle una ecuación de regresión mediante un software estadístico, con el 
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mantenimiento como variable dependiente y la edad, millas y tipo de autobús como variables inde- 
pendientes. 

a) Escriba el análisis de la ecuación de regresión múltiple. Comente cada variable. 

b) Determine e interprete el valor R 2 . 

c) Elabore una matriz de correlación. ¿Qué variables independientes tienen correlaciones fuertes 
o débiles con la variable dependiente? ¿Detecta algunos problemas con la multicolinealidad? 

d) Realice una prueba global de hipótesis en el conjunto de variables independientes. Interprete 
sus resultados. 

e) Realice una prueba de hipótesis con cada una de las variables independientes. ¿Consideraría 
eliminar algunas de estas variables? Si es así, ¿cuáles? 

f ) Realice de nuevo el análisis, hasta que sólo queden los coeficientes de regresión significativos. 
Identifique estas variables. 

g) Elabore un histograma o bien un diagrama de tallo y hojas de los residuos a partir de la ecua- 
ción de regresión final desarrollada en el inciso f). ¿Es razonable concluir que se cumplió la 
suposición de normalidad? 

h) Trace los residuos contra los valores ajustados a partir de la ecuación de regresión final. Trace 
los residuos en el eje vertical, y los valores ajustados, en el eje horizontal. 


Comandos de software 

Nota: No se presentan todos los pasos para todo el software 
estadístico que se emplea en este capítulo. A continuación se 
presentan los primeros dos, donde se muestran los pasos bási- 
cos. 

1. Los comandos en Minitab para la captura de pantalla de la 
regresión múltiple de la página 516 son: 

a) Importe los datos del sitio web del libro: www.mhhe. 
com/lind15e. El nombre del archivo es Tbl14-1. 

b) Seleccione Stat, Regression, y luego haga clic en 
Regression. 

c) Seleccione Cosí como la variable Response, y Temp, 
Insul, y Age como los Predictors; después haga clic en 

OK. 



2. Los comandos en Excel para producir la captura de pantalla 

de la regresión múltiple de la página 516 son: 

a) Importe los datos del sitio web del libro: www.mhhe. 
com/lind15e. El nombre del archivo es Tbl14. 

b) Seleccione Data en la barra de herramientas. En el 
extremo derecho, seleccione Data Analysis, resalte 
Regression, y haga clic en OK. 

c) Haga el Input Y Range A1:A21, el Input X Range 
B1:D21, marque el cuadro de Labels, el Output Range 
es G1 , y luego haga clic en OK. 



Repaso de los capítulos 13 y 14 
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Respuestas a las autoevaluaciones 



14-1 a) $389 500 o bien 389.5 (en miles de dólares); determi- 
nado por 

2.5 + 3(40) + 4(72) - 3(10) + .2(20) + 1(5) 

= 3895 

ib) La b 2 de 4 indica que la ganancia aumentará hasta 
$4 000 por cada hora extra que abra el restaurante (si 
no cambia ninguna otra variable). La b 3 de -3 implica 
que ia ganancia disminuirá $3 000 por cada milla adi- 
cional desde el área central (si no cambia ninguna otra 
variable). 

14-2 a) Los grados totales de libertad (n - 1) son 25. Por lo 
tanto, el tamaño muestral es 26. 

b) Hay 5 variables independientes. 

c) Sólo hay una variable dependiente (ganancia). 

d) Sy -|2345 = 1.4 1 4,, determinada por V2. 95% de los 
residuos estará entre -2.828 y 2.828, determinado por 
±2(1.414). 

e) R 2 = 0.714, determinado por 100/140. De la desvia- 
ción de la ganancia, 71 .4% se debe a estas cinco 
variables. 

f) f?a d j = .643, determinado por 


40 

/I" 140 

1(26 — (5 + 1)) J/ 

1(26 — 1)J 


14-3 a) H 0 : = |i 2 = P 3 = P 4 = P 5 = 0 

Hy. no todas las |3 son cero. 

La regla de decisión es rechazar H 0 si F > 2.71 . El va- 
lor calculado de Fes 10, determinado por 20/2. Por lo 
tanto, se rechaza H 0 , lo que indica que al menos uno 
de los coeficientes de regresión es diferente de cero. 

Basados en los valores p, la regla de decisión es 
rechazar ia hipótesis nula si el valor p es menor a 0.05 
El valor calculado de Fes 10, determinado por 20/2, y 
tiene un valor p de 0.000. Así, se rechaza la hipótesis 
nula, que indica que cuando menos uno de los coefi- 
cientes de regresión es distinto a cero. 


b) En el caso de la variable 1 : H 0 \ P-, = 0 y Hp fh A 0. 

La regla de decisión es: rechazar H 0 si f < -2.086, 
o si f > 2.086. Como 2.000 no sobrepasa estos lími- 
tes, no se rechaza la hipótesis nula. Este coeficiente 
de regresión puede ser cero. Puede considerar elimi- 
nar esta variable. Por lógica paralela, se rechaza la 
hipótesis nula para las variables 3 y 4. 

Para la variable 1 , la regla de decisión es rechazar 
H 0 \ (3-, = 0 si el valor p es menor a 0.05. Como el valor 
p es 0.056, no se puede rechazar la hipótesis nula. 
Este coeficiente de regresión podría ser cero. Por lo 
tanto, podemos considerar prescindir de esta variable. 
Por lógica paralela, se rechazan las hipótesis nulas 
para las variables 3 y 4. 

c) Se debe considerar la eliminación de las variables 1, 2 
y 5. La variable 5 tiene un valor absoluto menor de t. 
Por lo tanto, elimínela primero y vuelva a elaborar el 
análisis de regresión. 

14-4 a) Y = 15.7625 + 0.441 5X, + 3.8598X 2 


Y= 15.7625 + 0.4415(30) + 3.8598(1) 

= 32.87 

b) Las agentes ganan $3 860 más que los agentes. 

c) H 0 : P3 — 0 
H i : P 3 ^ 0 


gl = 17, rechace H 0 si f < -2.1 1 0, o si f > 2.1 1 0 


3.8598 - 0 
1.4724 


2.621 


El estadístico t excede el valor crítico de 2.110. También, 
el valor p = 0.0179 es menor que 0.05. Rechace H 0 Se 
debería incluir al género en la ecuación de regresión. 


Repaso de los capítulos 13 y 14 


La regresión simple y la 
correlación analizan la rela- 
ción entre dos variables. 


Esta sección es un repaso de los conceptos y términos más importantes que se presentaron en los 
capítulos 13 y 14. En el capítulo 13 se indicó que la fuerza de la relación entre la variable independien- 
te y la dependiente se mide con el coeficiente de correlación. El coeficiente de correlación se designa 
con la letra r, y adopta cualquier valor entre -1.00 y +1.00 inclusive. Los coeficientes de -1.00 y + 
1 .00 indican una relación perfecta, y un 0 indica que no hay relación. Un valor cercano a 0, como -0.14 
o 0.14, indica una relación débil. Una valor cercano a -1 o +1, como -0.90 o +0.90, indica una rela- 
ción fuerte. Al elevar al cuadrado r se obtiene el coeficiente de determinación, designado r 2 , e indica la 
proporción de la variación total en la variable dependiente explicada por la variable independiente. 

De igual forma, la fuerza de la relación entre diversas variables independientes y una variable 
dependiente se mide por el coeficiente de determinación múltiple, R 2 , que mide la proporción de la 
variación en Y explicada por dos o más variables independientes. 


568 


CAPÍTULO 14 Análisis de correlación y regresión múltiple 


La regresión y la correlación 
múltiple se ocupan de la rela- 
ción entre dos o más varia- 
bles independientes y la 
variable dependiente. 


La relación lineal en el caso simple que implica una variable independiente y una variable depen- 
diente se describe por la ecuación Y = a + bx. En el caso de tres variables independientes, X 1 ,X 2 y X 3 , 
la misma ecuación de regresión múltiple es la siguiente: 

Y = a + Í^Xi + b 2 X 2 + ■ ■ ■ + b k X k 


Despejar b-¡, b 2 , ■ ■ ■ , b k implicaría cálculos muy tediosos. Por fortuna, este problema se resuel- 
ve de manera rápida con uno de los muchos paquetes de software estadístico y paquetes de hojas de 
La computadora es muy útil cálculo. En la captura de pantalla de la mayoría de los programas de software se reportan varias medi- 

para calcular la regresión y dones, como el coeficiente de determinación, el error estándar de estimación múltiple, los resultados 

la correlación múltiple. de la prueba global y la prueba de las variables individuales. 


Glosario 


Capítulo 13 

Análisis de correlación Grupo de técnicas estadísticas para 
medir la fuerza de la relación entre dos variables. 

Coeficiente de correlación Medida de la fuerza de asociación 
entre dos variables. 

Coeficiente de determinación Proporción de la variación total 
de la variable dependiente que se explica por la variable indepen- 
diente. Adopta cualquier valor entre 0 y +1.00 inclusive. Este 
coeficiente se calcula al elevar al cuadrado el coeficiente de 
correlación, r. 

Diagrama de dispersión Gráfica que representa de manera 
visual la relación entre dos variables. 

Ecuación de regresión lineal Ecuación matemática que define 
la relación entre dos variables. Tiene la forma Y = a + bX. Se 
emplea para predecir Y con base en un valor X seleccionado. Y 
es la variable dependiente, y X, la independiente. 

Error estándar de estimación Mide la dispersión de los valo- 
res Y reales respecto de la recta de regresión. Se reporta en las 
mismas unidades que la variable dependiente. 

Método de mínimos cuadrados Técnica para llegar a la ecua- 
ción de regresión minimizando la suma de los cuadrados de las 
distancias verticales entre los valores Y actuales y los valores Y 
anticipados. 

Prueba f de la significación de r Fórmula para responder si la 
correlación entre la población de donde se seleccionó la muestra 
es cero. El estadístico de prueba es f, y el número de grados de 
libertad, n - 2. 


rVn - 2 

VT^T* 


( 13 - 2 ) 


Variable dependiente Variable por predecir o estimar. 

Variable independiente Variable que proporciona la base para 
la estimación. 


Capítulo 14 

Autocorrelación Correlación de varianzas residuales sucesi- 
vas. Esta condición sucede con frecuencia cuando se implica el 
tiempo en el análisis. 


Ecuación de regresión múltiple Relación entre la forma de 
una ecuación matemática y diversas variables independientes y 
una variable dependiente. La forma general es Y = a + ¿qX-, + 
b 2 X 2 + b 3 X 3 + ■ ■ ■ + b k X k . Se utiliza para estimar Y con k varia- 
bles independientes, X¡. 

Factor de inflación de la varianza Prueba para detectar la 
correlación entre variables independientes. 

Homoscedasticidad El error estándar de estimación es el mis- 
mo para todos los valores ajustado de la variable dependiente. 
Interacción Caso en el cual una variable independiente (como 
X 2 ) afecta la relación entre otra variable independiente (X-,) y la 
variable dependiente (Y). 

Matriz de correlación Enumeración de todos los coeficientes 
de correlación simples posibles. Una matriz de correlación inclu- 
ye las correlaciones entre cada una de las variables independien- 
tes y la variable dependiente, así como las que existen entre 
todas las variables independientes. 

Multicolinealidad Condición que se presenta en el análisis de 
regresión múltiple si las variables independientes se correlacio- 
nan entre sí. 

Prueba global Prueba para determinar si alguna de las varia- 
bles del conjunto de variables independientes tiene coeficientes 
de regresión diferentes de cero. 

Prueba individual Prueba para determinar si una variable inde- 
pendiente particular tiene coeficientes de regresión diferentes de 
cero. 

Regresión por pasos Proceso paso por paso para determinar 
la ecuación de regresión. Sólo las variables independientes con 
coeficientes de regresión distintos de cero entran en la ecuación 
de regresión. Se agrega una variable independiente a la vez a la 
ecuación de regresión. 

Residuo Diferencia entre el valor real de la variable dependiente 
y el valor estimado de la variable dependiente, es decir, Y — Y. 
Variable ficticia Variable cualitativa. Asume sólo uno de dos 
resultados posibles. 

Variables cualitativas Variable de escala nominal que se codi- 
fica para asumir sólo uno de dos resultados posibles. Por ejem- 
plo, una persona se considera empleada o desempleada. 


Problemas 


569 


Problemas 


1. El departamento de contabilidad de Crate and Barrel desea estimar la ganancia de cada una de 
las muchas tiendas de la cadena con base en el número de empleados de cada una de ellas, cos- 
tos generales, márgenes de ganancia promedio y pérdidas por robo. Algunos estadísticos de las 
tiendas son: 



Ganancias 

Número 

Costo general 

Margen de 

Pérdidas por 


netas (miles 

de 

(miles 

ganancia promedio 

robo (miles 

Tienda 

de dólares) 

empleados 

de dólares) 

(porcentaje) 

de dólares) 

1 

$846 

143 

$79 

69% 

$52 

2 

513 

110 

64 

50 

45 


a) La variable dependiente es . 

b) La ecuación general de este problema es . 

c) La ecuación de regresión múltiple se calculó Y = 67 + 8X 1 - 10X 2 + 0.004X 3 - 3X 4 . ¿Cuáles 
son las ventas anticipadas de una tienda con 1 1 2 empleados, un costo general de $65 000, una 
tasa del margen de ganancia de 50% y pérdidas por robo de $50 000? 

d) Suponga que R 2 se calculó en 0.86. Explique este valor. 

e) Suponga que el error estándar de estimación múltiple fue 3 (en miles de dólares). Explique qué 
significa este valor en este problema. 

2. Las compañías de impresión rápida en un área grande comercial del centro gastan la mayoría de 
su dinero en publicidad en anuncios en las bancas de espera del autobús. Un proyecto de inves- 
tigación implica predecir las ventas mensuales con base en la cantidad anual que gastan en la 
colocación de anuncios en las bancas. Una muestra de compañías de impresión rápida reveló los 
siguientes gastos en publicidad y ventas: 


Compañía 

Publicidad anual 
en bancas de 
autobuses (miles 
de dólares) 

Ventas 
mensuales 
(miles 
de dólares) 

A 

2 

10 

B 

4 

40 

C 

5 

30 

D 

7 

50 

E 

3 

20 


a) Trace el diagrama de dispersión. 

b) Determine el coeficiente de correlación. 

c) ¿Cuál es el coeficiente de determinación? 

d) Calcule la ecuación de regresión. 

e) Estime las ventas mensuales de una compañía de impresión rápida que gasta $4 500 en publi- 
cidad en bancas de autobuses. 

f) Resuma sus resultados. 

3. Se proporciona la siguiente captura de pantalla de una tabla ANOVA: 


FUENTE Suma de cuadrados 

GL 

MS 

Regresión 

1050 . 8 

4 

262.70 

Error 

83 . 8 

20 

4 . 19 

Total 

1134 . 6 

24 



Desviación 


Factor de 

predicción Coef 

estándar 

Razón t 

Constante 

70 . 06 

2.13 

32.89 


0.42 

0 . 17 

2 .47 

*2 

0.27 

0.21 

1.29 

Xa 

0 . 75 

0 .30 

2.50 

X 4 

0.42 

0 . 07 

6 . 00 
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a) Calcule el coeficiente de determinación. 

b) Calcule el error de estimación múltiple. 

c) Realice una prueba de hipótesis para determinar si algunos de los coeficientes de regresión son 
diferentes de cero. 

d) Realice una prueba de hipótesis de los coeficientes de regresión individuales. ¿Se puede elimi- 
nar alguna de las variables? 


Casos 


A. El Century National Bank 

Consulte ios datos del Century National Bank. Utilice el saldo de 
cuentas de cheques como variable dependiente y, como varia- 
bles independientes, el número de transacciones en cajeros 
automáticos, el número de otros servicios empleados, si ei indi- 
viduo tiene tarjeta de crédito y si se paga interés en la cuenta en 
particular; indique en un reporte qué variables parecen relacio- 
narse con el saldo de la cuenta y si explican bien la variación de 
los saldos de las cuentas. ¿Se deben emplear todas las variables 
propuestas en el análisis, o se pueden eliminar algunas? 

B. Terry and Associates: 

Tiempo para entregar equipos médicos 

Terry and Associates es un centro especializado en pruebas 
médicas de Denver, Colorado. Una de las fuentes principales de 
ingresos de la compañía es un equipo para detectar cantidades 
elevadas de plomo en la sangre. Los trabajadores en talleres de 
hojalatería de autos, en la industria de jardinería y los pintores 
comerciales de casas están expuestos a grandes cantidades de 
plomo y, por lo tanto, se deben someter a una prueba de forma 
aleatoria. Es muy costoso realizar la prueba, por lo que los equi- 
pos se suministran por pedido a diversos lugares del área de 
Denver. 

Kathleen Terry, la propietaria, tiene interés en determinar los 
costos adecuados por entrega. Para investigar esto, Terry reunió 
información sobre una muestra aleatoria de 50 entregas recien- 
tes. Los factores que se consideran relacionados con el costo de 
entrega de un equipo son: 

Preparación El tiempo en minutos desde la recepción del pe- 
dido por teléfono y cuando el equipo está listo 
para su entrega. 

Entrega El tiempo de recorrido real en minutos desde la 
planta de Terry hasta el cliente. 

Millas La distancia en millas desde la planta de Terry 
hasta el cliente. m 


Número de 
muestra 

Costo 

Preparación 

Entrega 

Millas 

1 

$32.60 

10 

51 

20 

2 

23.37 

11 

33 

12 

3 

31.49 

6 

47 

19 

4 

19.31 

9 

18 

8 

5 

28.35 

8 

88 

17 

6 

22.63 

9 

20 

11 

7 

22.63 

9 

39 

11 

8 

21.53 

10 

23 

10 

9 

21.16 

13 

20 

8 

10 

21.53 

10 

32 

10 

11 

28.17 

5 

35 

16 


Número de 
muestra 

Costo 

Preparación 

Entrega 

Millas 

12 

$20.42 

7 

23 

9 

13 

21.53 

9 

21 

10 

14 

27.55 

7 

37 

16 

15 

23.37 

9 

25 

12 

16 

17.10 

15 

15 

6 

17 

27.06 

13 

34 

15 

18 

15.99 

8 

13 

4 

19 

17.96 

12 

12 

4 

20 

25.22 

6 

41 

14 

21 

24.29 

3 

28 

13 

22 

22.76 

4 

26 

10 

23 

28.17 

9 

54 

16 

24 

19.68 

7 

18 

8 

25 

25.15 

6 

50 

13 

26 

20.36 

9 

19 

7 

27 

21.16 

3 

19 

8 

28 

25.95 

10 

45 

14 

29 

18.76 

12 

12 

5 

30 

18.76 

8 

16 

5 

31 

24.29 

7 

35 

13 

32 

19.56 

2 

12 

6 

33 

22.63 

8 

30 

11 

34 

21.16 

5 

13 

8 

35 

21.16 

11 

20 

8 

36 

19.68 

5 

19 

8 

37 

18.76 

5 

14 

7 

38 

17.96 

5 

11 

4 

39 

23.37 

10 

25 

12 

40 

25.22 

6 

32 

14 

41 

27.06 

8 

44 

16 

42 

21.96 

9 

28 

9 

43 

22.63 

8 

31 

11 

44 

19.68 

7 

19 

8 

45 

22.76 

8 

28 

10 

46 

21.96 

13 

18 

9 

47 

25.95 

10 

32 

14 

48 

26.14 

8 

44 

15 

49 

24.29 

8 

34 

13 

50 

24.35 

3 

33 

12 


1. Formule la ecuación de regresión lineal múltiple que descri- 
ba la relación entre el costo de entrega y las demás varia- 
bles. ¿Estas tres variables explican una cantidad razonable 


Test de práctica 
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de ia variación de la variable dependiente? Estime el costo 
de entrega de un equipo cuya preparación tarda 10 minutos, 
30 minutos su entrega, y debe recorrer una distancia de 14 
millas. 

2 . Haga una prueba para determinar que al menos un coefi- 
ciente de regresión neto difiere de cero. Asimismo, pruebe si 


algunas variables se pueden omitir del análisis. Si algunas 
variables se pueden omitir, efectúe de nuevo la ecuación de 
regresión hasta que sólo se incluyan variables significativas. 
Interprete en un reporte breve la ecuación de regresión final. 

3. Escriba un breve reporte en el cual interprete la ecuación de 
regresión final. 


Test de práctica 


Parte 1 : Objetivo 

1. En un diagrama de dispersión, ¿en qué eje se registra siempre ia variable dependiente? 

2. ¿Qué nivel de medición se requiere para calcular el coeficiente de correlación? 

3. Si no existe correlación entre dos variables, ¿cuál es el valor del coeficiente de correlación? 


1 . 

2 . 


4 . ¿Cuál de los siguientes valores indica la correlación más fuerte entre dos variables (0.65, -0.77, 0, -.12)? 

4 

5 . ¿Bajo qué condiciones asumirá el coeficiente de determinación un valor mayor al? 5 

Dada la siguiente ecuación de regresión Y = 7 - .5X, y si el coeficiente de determinación es 0.81 , conteste las preguntas 7, 8 y 9. 


6 . 


6. ¿En qué punto cruza ia ecuación de regresión el eje y? 

7 . ¿Un aumento de una unidad en la variable independiente resultará en qué cantidad de incremento o disminución de la variable 

independiente? 7 

8. ¿Cuál es el coeficiente de correlación? (Cuidado con el signo.) 8 

9 . Si todos los puntos de un diagrama de dispersión estuvieran en la recta de regresión, ¿cuál sería el valor del error estándar de 

estimación? 9 

10 . En una ecuación de regresión múltiple, ¿cuál es el máximo número permitido de variables independientes (2, 10, 30, ilimitado)? 

10 

11. En un análisis de regresión múltiple, ¿ qué tipo de relación supuesta existe entre la variable independiente y el grupo de varia- 
bles independientes (lineal, múltiple, curva, ninguna de las anteriores)? 11 

12. La diferencia entre V y V se denomina 12 

13. ¿Cuántos resultados diferentes son posibles para una variable ficticia en particular, como el género? 


13 . 


14 . ¿Cuál es el nombre dado a una tabla que muestra todos los posibles coeficientes de relación entre la variable dependiente y 

todas las variables independientes, y entre todas éstas? 14 

15 . Si existe una relación lineal entre la variable dependiente y el grupo de variables independientes, ¿qué tipo de gráfica de resi- 
duos mostrará el tipo de distribución? 15 


Parte 2: Problemas 

1. Dada la siguiente captura de pantalla: 


Análisis de regresión 


Tabla ANOVA 

Fuente 

SS 

gi 

MS 

F 

valor p 

Regresión 

129.7275 

i 

129.7275 

14.50 

.0007 

Residuo 

250.4391 

28 

8.9443 



Total 

380.1667 

29 




Salida de regresión 

Variables 

Coeficientes 

Error estándar 

t [gi = 28 ) 



Intersección 

90.6190 

1.5322 

59.141 



Pendiente 

-0.9401 

0.2468 

-3.808 




a) ¿De qué tamaño es la muestra? 

b) Escriba la ecuación de regresión. Interprete los valores de la pendiente y de la intersección. 

c) Si el valor de la variable independiente es 10, ¿cuál es el valor de la variable dependiente? 

d) Calcule el coeficiente de determinación. Interprete su valor. 

e) Calcule el coeficiente de relación. Realice una prueba de hipótesis para determinar si existe una asociación negativa signifi- 
cativa entre las variables. 
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CAPÍTULO 14 Análisis de correlación y regresión múltiple 


2. Dada la siguiente captura de pantalla: 


Análisis de regresión 


Tabla ANOVA 

Fuente 

ss 

gi 

MS 

F 

valor p 

Regresión 

227.0928 

4 

56.7732 

9.27 

0.000 

Residuo 

153.0739 

25 

6.1230 



Total 

380.1667 

29 




Salida de regresión 

Variables 

Coeficientes 

Error estándar t (gl = 25) 

valor p 


Intersección 

68.3366 

8.9752 

7.614 

0.000 


XI 

0.8595 

0.3087 

2.784 

0.010 


X2 

-0.3380 

0.8381 

-0.403 

0.690 


X3 

-0.8179 

0.2749 

-2.975 

0.006 


X4 

-0.5824 

0.2541 

-2.292 

0.030 



a) ¿De qué tamaño es la muestra? 

b) ¿Cuántas variables independientes hay en el estudio? 

c) Determine el coeficiente de determinación. 

d) Realice una prueba global de la hipótesis. ¿Puede concluir que al menos una de las variables independientes no es igual a 
cero? Utilice un nivel de significancia de 0.01 . 

e) Realice la prueba de hipótesis individual a cada una de las variables independientes. ¿Consideraría retirar alguna de ellas? Si 
es así, ¿qué variable o variables eliminaría? Utilice un nivel de significancia de 0.01. 



1 

Números índice 



Objetivos de 
aprendizaje 


Al concluir el capítulo, será 
capaz de: 


OA1 Calcular e Interpretar un 
índice simple. 



OA2 Comprender la 
diferencia entre un índice 
ponderado y uno no 
ponderado. 

OA3 Elaborare interpretar un 
índice de precios de Laspeyres. 

OA4 Elaborar e interpretar un 
índice de precios de Paasche. 

OA5 Elaborar e interpretar un 
índice de valores. 

OA6 Explicar cómo se 
elabora y se interpreta el 
índice de Precios al 
Consumidor. 


En el ejercicio 27 se proporciona Información sobre precios y 
cantidades de margarina, manteca, leche y papas fritas de los años 
2000 y 2009. Calcule un índice de precios simple de cada uno de los 
cuatro artículos, y considere el año 2000 el periodo base. (Vea 
ejercicio 27, objetivo 1 .) 
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CAPÍTULO 15 Números índice 


15.1 Introducción 

En este capítulo se analiza una útil herramienta descriptiva denominada índice. Un índice 
expresa el cambio relativo de un valor de un periodo a otro. Sin duda, conoce índices como el 
índice de Precios al Consumidor, que en Estados Unidos es publicado cada mes por el U.S. 
Department of Labor. Hay muchos índices, como el Dow Jones Industrial Average (DJIA), 
Nasdaq, NIKKEI 225 y Standard & Poor’s 500 Stock Average. El gobierno federal estadou- 
nidense publica índices de manera periódica en revistas de negocios como BusinessWeek y 
Forbes, en la mayoría de los periódicos y en internet. 

¿Qué importancia tiene un índice? ¿Por qué es tan importante y popu- 
lar el índice de Precios al Consumidor? Como su nombre lo indica, mide 
el cambio de precios de un grupo grande de artículos que compran los 
consumidores. El Departamento de la Reserva Federal, grupos de consu- 
midores, sindicatos, gerentes, organizaciones de personas de la tercera 
edad, y otras organizaciones de negocios y de la economía se preocupan 
por los cambios de precios. Estos grupos vigilan muy de cerca el índice de 
Precios al Consumidor, así como el índice de Precios al Productor, que 
mide las fluctuaciones de los precios en todas las etapas de la producción. 
Con el fin de combatir aumentos de precios repentinos, con frecuencia la 
Reserva Federal estadounidense aumenta la tasa de interés para “enfriar” 
la economía. De igual forma, el Promedio Industrial Dow Jones, que se 
actualiza de manera continua, describe el cambio general de precios de 
las acciones comunes de 30 grandes compañías. 

Algunos índices del mercado accionario aparecen a diario en la sec- 
ción financiera de la mayoría de los periódicos. Muchos se reportan en 
tiempo real, como en la sección de negocios del sitio en internet de USA 
Today (http://www.usatoday.com/money/default.htm). A continuación se 
presenta el Promedio Industrial Dow Jones, el Nasdaq y el S&P 500 del 
sitio de internet de USA Today. 



Market Summary 
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15.2 Números índice simples 

0A1 Calculare interpretar ¿Qué es un número índice? Un índice o número índice mide el cambio que se produce en un 

un índice simple. artículo en particular (un producto o servicio) entre dos periodos. 


NÚMERO ÍNDICE Número que expresa el cambio relativo de precio, cantidad o valor compara- 
do con un periodo base. 


Si el número índice se utiliza para medir el cambio relativo de una sola variable, como los sala- 
rios por hora en la manufactura, es un índice simple. Es la razón de dos variables, y dicha 
razón se convierte en un porcentaje. Los siguientes cuatro ejemplos servirán para ¡lustrar el 
uso de los números índices. Como se observa en la definición, su uso principal en los nego- 
cios es mostrar el cambio de uno o más aspectos de un periodo a otro. 



15.2 Números índice simples 


575 



Puede revisar la información más reciente sobre salarios, los índices de Precios al 
Consumidor y otros valores relacionados con los negocios en el sitio de internet del Bureau of 
Labor Statistics (BLS), http://www.bls.gov, haga clic en Wages. En la siguiente tabla se mues- 
tran algunos estadísticos del BLS. 
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CAPÍTULO 15 Números índice 


Cjemplo 


Solución 


En la siguiente captura de pantalla de Excel se muestra el número de pasajeros (en millones) 
de los cinco aeropuertos más grandes de Estados Unidos en 2009. ¿Cuál es el índice de 
Atlanta, Chicago, Los Angeles y Dallas/Ft. Worth en comparación con Denver? 



A 

• 


Q 

AJrpost 

1 

Nombtr o4 Pitunj#n (mtlliomj 


Indi* 

7 A'rp<ír! |ATq 

90.0 


175 1 

i OHm intamational Airport (ORO| 

09 3 


134.9 

4 u» Antctri •ntt*n«(ion4< Aapor il*« | 

59.5 


115# 

5 wortMnt«m*t«OA*i Airport (OPW) 

57.0 


110.» 

• Danwar Intwnatienjl A«port (OCNI 

SU 


100.0 

7 

Number of Passengersat the Five Busiest US Airports 


10 T_ 












U 4 








i' i . - 

M 




Ü 4— 




19 00 

200 400 00 0 NO 

100 0 


Para determinar los cuatro índices, se dividen los pasajeros de Atlanta, Chicago, Los Angeles 
y Dallas/Ft. Worth entre el número de Denver. Se concluye que Atlanta tuvo 75.1 % más pasa- 
jeros que Denver, Chicago 34.8% más, Los Angeles 15.8% más y Dallas/Ft. Worth 10.9% más. 


Aeropuerto 

Pasajeros 

(millones) 

índice 

Determinado 

por 

Hartsfield-Jackson Atlanta 

International Alrport (ATL) 

90.0 

175.1 

(90.0/51 ,4)(1 00) 

O’Hare International Airport (ORD) 

69.3 

134.8 

(69.3/51 .4)(1 00) 

Los Angeles 

International Airport (LAX) 

59.5 

115.8 

(59.5/51 .4)(1 00) 

Dallas-Fort Worth 

International Airport (DFW) 

57.0 

110.9 

(57.0/51 ,4)(1 00) 

Denver International Airport (DEN) 

51 .4 

100.0 

(51 .4/51 .4)(1 00) 


Del análisis anterior observe que: 

1. El índice de salarios por hora promedio de los obreros (132.81) es un porcentaje, pero el 
símbolo de porcentaje casi siempre se omite. 

2. Cada índice tiene un periodo base. En el ejemplo respecto del salarlo por hora promedio 
de los obreros, se utilizó 2000 como periodo base. El periodo base del índice de Precios 
al Consumidor es 1993-1995. La razón de paridad, que es la razón entre los precios que 
recibieron los agricultores y los precios pagados por ellos, aún tiene 1910-1914 como 
periodo base. 

3. La mayoría de los índices, en negocios y en economía, se calculan hasta el número ente- 
ro más cercano, como 214 o 96, o hasta el décimo más cercano de un porcentaje, como 
83.4% o 118.7%. 



15.4 Elaboración de números índice 
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Los índices permiten expresar 
un cambio de precio, 
cantidad o valor como 
porcentaje. 


15.3 / Por qué convertir datos en índices? 

La recopilación de números índice no es una innovación reciente. A un italiano, G.R. Carli, se 
le acredita la creación de los números índice en 1764. Los incorporó en un reporte que hizo 
respecto de las fluctuaciones de precios en Europa de 1500 a 1750. En Estados Unidos no 
hubo un enfoque sistemático evidente para recopilar y reportar datos en forma de índice hasta 
alrededor de 1900. El índice del costo de la vida (que en la actualidad se denomina índice 
de Precios al Consumidor) se introdujo en 1913, y desde entonces se compila una larga lis- 
ta de índices. 

¿Por qué convertir los datos en índices? Un índice es una forma conveniente para expre- 
sar un cambio en un grupo diverso de artículos. El índice de Precios al Consumidor (IPC), por 
ejemplo, abarca cerca de 400 artículos, entre ellos pelotas de golf, podadoras de césped, 
hamburguesas, servicios funerarios y tarifas de dentistas. Los precios se expresan en dólares 
por libra, caja, yarda y muchas otras unidades distintas. Sólo mediante la conversión de los 
precios de estos diversos bienes y servicios en un número índice, el gobierno federal estadou- 
nidense y otros organismos preocupados con la inflación se mantienen informados del movi- 
miento general de los precios al consumidor. 

La conversión de datos en índices también facilita la evaluación de la tendencia en una 
serie compuesta de números muy grandes. Por ejemplo, la estimación de las ventas al menu- 
deo por internet (e-commerce) del cuarto semestre de 2010, ajustado a la variación estacio- 
nal, fue de $36 200 000. Las ventas de e-commerce del cuarto trimestre de 2009 sumaron de 
$30 700 000. Esta cifra representa un incremento de $5 500 000. Si las ventas de e-commer- 
ce del cuarto trimestre de 201 0 se expresan como un índice basado en el cuarto trimestre de 
2009, el aumento es de 17.9%. 

Ventas de e-commerce, 4o. trim. 201 0 $36 200 000 , . . . _ _ 

1 00) = i 1 00) = 11 7.9 

Ventas de e-commerce, 4o. trim. 2009 $30 700 000 


15.4 Elaboración de números índice 

Ya hemos visto cómo se elabora un índice de precios simple. El precio de un año selecciona- 
do (como 2010) se divide entre el precio del año base. El precio en el periodo base se desig- 
na p 0 , y un precio que no sea el periodo base se conoce como periodo dado o seleccionado, 
y se designa p t . Para calcular este índice de precios simple P con 100 como valor base de un 
periodo dado, utilice la fórmula: 


r 


INDICE SIMPLE 




p = 


— X 100 
Po 


(15-1) 


Suponga que el precio de un paquete de vacaciones de fin de semana durante el otoño 
(con alojamiento y todos los alimentos) en Tryon Mountain Lodge, en el oeste de Carolina del 
Norte en 2000, fue de $450. El precio aumentó a $795 en 2010. ¿Cuál es el índice de precios 
de 2010 con el año 2000 como periodo base y 100 como valor base? Es 176.7, determinado 
por: 


P = — (1 00) = (1 00) = 1 76.7 

Po $450 

La interpretación de este resultado es que el precio del paquete de fin de semana durante el 
otoño aumentó 76.7% de 2000 a 2010. 

El periodo base no necesita ser un año individual. Observe en la tabla 15-1 que si se 
emplea 2000-2001 = 100, el precio base de la engrapadora sería de $21 [determinado al cal- 
cular el precio medio de 2000 y 2001: ($20 + $22)/2 = $21]. Los precios $20, $22 y $23 se 
promedian si se selecciona 2000-2002 como base. El precio medio sería de $21.67. Los índi- 
ces elaborados con los tres periodos bases distintos se reportan en la tabla 15-1. (Observe 
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CAPÍTULO 15 Números índice 


que, cuando 2000-2002 = 100, los números índice de 2000, 2001 y 2002 promedian 100.0, 
como cabría esperar.) Como es lógico, los números índice de 2010 con las tres bases distin- 
tas no son iguales. 


TABLA 15-1 Precios de una engrapadora automática Benson, modelo 3, convertidos en índices con 
tres periodos bases distintos 



Precio 

índice de 


índice de 


índice de 


de la 

precios 


precios 


precios 

Año 

engrapadora 

(2000 = 100) 

(2000-2001 = 100) 

(2000-2002 = 100) 

1995 

$18 

90.0 

18 

X 100 = 85.7 

18 

X 100 = 83.1 



21 


21.67 


2000 

20 

100.0 

20 

X 100 = 95.2 

20 

X 100 = 92.3 




21 


21.67 


2001 

22 

110.0 

22 

X 100 = 104.8 

22 

X 100 = 101.5 

21 


21.67 


2002 

23 

115.0 

23 

X 100 = 109.5 

23 

X 100 = 106.1 


21 


21.67 


2010 

38 

190.0 

38 

X 100 = 181.0 

38 

X 100 = 175.4 




21 


21.67 




1 . A continuación se presentan las principales naciones productoras de acero, en millones de 
toneladas, durante 2009. Exprese la cantidad que produjo China, la Comunidad Europea, 
Japón y Rusia como índice, y utilice a Estados Unidos como base. ¿Qué porcentaje produce 
China más que Estados Unidos? 


Nación 

Cantidad (millones 
de toneladas) 

República popular de China 

500.5 

Comunidad Europea 

198.0 

Japón 

118.7 

Estados Unidos 

91.4 

Rusia 

68.5 


2. A continuación se presentan los salarios por hora promedio de obreros durante enero de años 
seleccionados. 


Año 

Salarios por hora promedio 

1995 

$11.65 

2000 

14.02 

2005 

16.13 

2010 (May) 

19.01 


a) Con 1995 como periodo base y 100 como valor base, determine los índices de otros años. 
Interprete el índice. 

b) Utilice el promedio de 1995 y 2000 como base y determine los índices de los demás años. 
Interprete el índice. 


Ejercicios 


comect 


1. PNC Bank, Inc., con sede en Pittsburgh, Pennsylvania, reportó $17 446 (millones) en concepto de 
préstamos comerciales en 1995, $19 989 en 1997, $21 468 en 1999, $21 685 en 2000, $15 922 en 
2002, $18 375 en 2004 y $54 818 en 2009. Utilice 1995 como base y desarrolle un índice simple 



15.5 índices no ponderados 
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OA2 Comprender la 
diferencia entre un índice 
ponderado y uno no 
ponderado. 


que muestre el cambio de la cantidad de préstamos comerciales durante los años 1997, 1999, 
2000, 2002, 2004 y 2009, con base en 1995. 

2. En la siguiente tabla se reportan las ganancias de cada una de las acciones comunes de Home 
Depot, Inc., en años recientes. Desarrolle un índice, con 2001 como base, que muestre el cambio 
de las ganancias por acción durante el periodo. m 


Año 

Ganancias por acción 

Año 

Ganancias por acción 

2001 

$1.29 

2006 

$2.63 

2002 

1.56 

2007 

2.55 

2003 

1.88 

2008 

2.27 

2004 

2.26 

2009 

0.71 

2005 

2.72 

2010 

1.70 


3. A continuación se enumeran las ventas netas de Blair Corporation, minorista de ventas por correo 
ubicada en Warren, Pennsylvania, durante los años de 1997 a 2006. En 2007, Blair se convirtió en 
una subsidiaria de Applessed’s Topeo. Su sitio en la red es www.blair.com. Utilice las ventas 
medias de los primeros tres años para determinar una base y luego determine el índice de 2003 y 
2006. ¿En cuánto aumentaron las ventas netas desde el periodo base? 


Año 

Ventas (millones) 

Año 

Ventas (millones) 

1997 

$486.6 

2002 

$568.5 

1998 

506.8 

2003 

581.9 

1999 

522.2 

2004 

496.1 

2000 

574.6 

2005 

456.6 

2001 

580.7 

2006 

433.3 


4. En enero de 1994, el precio de un pollo fresco entero fue $0.899 por libra. En abril de 2010, el pre- 
cio del mismo pollo fue de $1.230 por libra. Utilice el precio de enero de 1994 como periodo base 
y 100 como valor base para desarrollar un índice simple. ¿Qué porcentaje aumentó el precio del 
pollo? 


15.5 índices no ponderados 

En muchas situaciones se desea combinar vahos artículos y elaborar un índice para comparar 
el costo de este agregado de artículos en dos periodos distintos. Por ejemplo, podría necesi- 
tarse un índice que englobe los artículos que se relacionan con el gasto de operación y mante- 
nimiento de un automóvil. Los artículos del índice pueden abarcar los precios de los 
neumáticos, cambios de aceite y gasolina. O bien podría necesitarse un índice para estudian- 
tes universitarios. Este índice puede abarcar el costo de libros, colegiatura, alojamiento, alimen- 
tos y entretenimiento. Hay varias formas de combinar los artículos para determinar un índice. 

Promedio simple de los índices de precios 

En la tabla 1 5-2 se reportan los precios de varios artículos de alimentos de 1 999 a 2009. Usted 
desea elaborar con ellos el índice de 2009, usando 1999 como base. Esto se expresa con el 
código abreviado 1999 = 100. (Debemos recalcar que 1999=100 es tan solo una notación 
convencional para especificar que 1999 es el año base y no una igualdad entre valores numé- 
ricos como tal.) 

Inicie con el cálculo de un promedio simple de los índices de precios de cada artículo, 
emplee 1999 como año base y 2009 como año dado. El índice simple del pan es 147.1, que 
se determina con la fórmula (15-1). 

o 1 28 

P = — (100) = — — (100) = 147.1 
P o - 87 

Calcule el índice simple de los demás artículos de la tabla 15-2 de manera similar. El aumen- 
to de precio mayor afectó a los huevos, 106.7%, y el pan quedó en segundo lugar, con 47.1 %. 
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TABLA 15-2 Cálculo del índice de precios de alimentos 2009, 1999 = 100 


Artículo 

Precio en 1999 

Precio en 2009 

índice simple 

Pan blanco, costo por libra 

$ 0.87 

$ 1.28 

147.1 

Huevos, docena 

1.05 

2.17 

206.7 

Leche blanca, galón 

2.94 

3.87 

131.6 

Manzanas, Red Delicious, 1 libra 

0.86 

1.16 

134.9 

Jugo de naranja, concentrado, 12 onzas 

1.75 

2.54 

145.1 

Café, 100% grano tostado, 1 libra 

3.43 

3.68 

107.3 

Total 

$10.90 

$14.70 



El precio del café aumentó 7.3%, determinado por 107.3 - 100 = 7.3. Luego sería natural pro- 
mediar los índices simples. La fórmula es: 


PROMEDIO SIMPLE DE LOS PRECIOS RELATIVOS 



( 15 - 2 ) 


y 


donde P¡ representa el índice simple de cada uno de los artículos, y n, el número de artículos. 
En este ejemplo, el índice es 145.5, determinado por: 

p = = 147.1 +•■■ + 107.3 _ 872.7 _ 

n 6 6 

Esto Indica que la media del grupo de índices aumentó 45.5% de 1999 a 2009. 

Una característica positiva del promedio simple de índices de precios es que se obtendría 
el mismo valor del índice sin Importar las unidades de medida. En el índice anterior, si las man- 
zanas estuvieran en toneladas, en lugar de libras, el impacto de las manzanas en el índice 
combinado no cambiaría. Es decir, la mercancía “manzanas” representa uno de seis artículos 
incluido en el índice, por lo cual el efecto del artículo no se relaciona con las unidades. Una 
característica negativa de este índice es que no considera la Importancia relativa de los ar- 
tículos que se consideran. Por ejemplo, la leche y los huevos reciben la misma ponderación, 
si bien una familia común puede gastar mucho más durante el año en leche que en huevos. 

índice agregado simple 

Una segunda posibilidad es sumar los precios (en lugar de los índices) de los dos periodos y 
luego determinar el índice con base en los totales. La fórmula es: 


ÍNDICE AGREGADO SIMPLE 



X 100 


( 15 - 3 ) 


y 


A éste se le denomina índice agregado simple. El índice de los artículos de alimentos ante- 
riores se determina al sumar los precios de 1999 y 2009. La suma de los precios del periodo 
base es $10.90, y del periodo dado, $14.70. El índice agregado simple es 134.9, lo que signi- 
fica que el grupo de precios agregado aumentó 34.9% en el periodo de 10 años. 


P = 


2p ; 

2p 0 


( 100 ) 


$14.70 

$10.90 


(100) = 134.9 


Como en el valor de un índice agregado simple pueden Influir las unidades de medición, 
no se emplea con frecuencia. En este ejemplo, el valor del índice diferiría de manera significa- 
tiva si se fuera a reportar el precio de las manzanas en toneladas en lugar de libras. También 
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OA3 Elaborar e interpretar 
un índice de precios de 
Laspeyres. 


Cjemplo 


Solución 


observe el efecto del café en el índice total. En los años actual y base, el café es un contribu- 
yente importante al índice total, por lo que un cambio de su precio incidirá en el índice mucho 
más que cualquier otro artículo. En consecuencia, es necesario encontrar una forma de “pon- 
derar” de manera aproximada los artículos de acuerdo con su Importancia relativa. 


15.6 índices ponderados 

Los dos métodos más conocidos para calcular el índice de precios ponderado son el de 
Laspeyres y el de Paasche. Difieren sólo en el periodo de la ponderación. Cuando se emplea 
el método de Laspeyres se aplican ponderaciones en el período base\ es decir, los precios y 
las cantidades originales de los artículos comprados se utilizan para encontrar el cambio por- 
centual durante un periodo, ya sea en el precio o en la cantidad consumida, según el proble- 
ma. En el método de Paasche se aplican ponderaciones en el año en curso. 

índice de precios de Laspeyres 

A finales del siglo xvni, Etienne Laspeyres desarrolló un método para determinar un índice de 
precios ponderado con las cantidades del periodo base como ponderaciones. Según dicho 
método, un índice de precios ponderado se calcula mediante: 


ÍNDICE DE PRECIOS DE LASPEYRES 


p = 2p,q o 

2p 0 q 0 


X 100 


(15-4) 


donde 

P es el índice de precios. 
p ( es el precio actual. 
p 0 es el precio en el periodo base. 
q 0 es la cantidad en el periodo base. 


Los precios de los seis artículos de alimentos de la tabla 15-2 se repiten a continuación en la 
tabla 15-3. También se incluye el número de unidades de cada uno, consumido por una fami- 
lia normal en 1999 y 2009. 

TABLA 15-3 Precio y cantidad de artículos de alimentos en 1999 y en 2009 


Articulo 

Precio 
en 1999 

Cantidad 
en 1999 

Precio 
en 2009 

Cantidad 
en 2009 

Pan blanco, costo por libra 

$0.87 

50 

$1.28 

55 

Huevos, docena 

1.05 

26 

2.17 

20 

Leche blanca, galón 

2.94 

102 

3.87 

130 

Manzanas, Red Delicious, 1 libra 

0.86 

30 

1.16 

40 

Jugo de naranja, concentrado, 12 onzas 

1.75 

40 

2.54 

41 

Café, 100% de grano tostado, 1 libra 

3.43 

12 

3.68 

12 


Determine un índice de precios ponderado con el método de Laspeyres. Interprete el resultado. 


Primero determine la cantidad total que se gastó en los seis artículos en el periodo base, 1999. 
Para encontrar este valor multiplique el precio en el periodo base del pan ($0.87) por la canti- 
dad en el periodo base de 50. El resultado es $43.50. Esta cifra indica que se gastó un total de 
$43.50 en el periodo base en pan. Continúe de la misma manera con todos los artículos y sume 
los resultados. El total del periodo base es de $507.64. El total del periodo actual se calcula de 
manera similar. En el caso del primer artículo, pan, multiplique la cantidad en 1999 por el pre- 
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ció del pan en 2009, es decir, $1 .28(50). El resultado es $64.00. Haga el mismo cálculo con 
cada artículo y sume el resultado. El total es $695.72. Debido a la naturaleza repetitiva de estas 
operaciones, una hoja de cálculo es útil para realizarlos. La siguiente es una reproducción de 
la captura de pantalla de Excel. 
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El índice de precios ponderado de 2009 es 137.0, determinado por: 


P = 


^PtQo 

2p 0 q 0 


( 100 ) 


$695.72 

$507.64 


(100) = 137.0 


Con base en este análisis se concluye que el precio de este grupo de artículos aumentó 
37.0% en el periodo de diez años. La ventaja de este método sobre el índice agregado simple 
es que se considera la ponderación de cada artículo. En el índice agregado simple, el café 
representaba alrededor de 40% de la ponderación para determinar el índice. En el índice de 
Laspeyres, el artículo con la ponderación mayor es la leche, debido a que el precio del produc- 
to y las unidades que se vendieron son los mayores. 


índice de precios de Paasche 

OA4 Elaborar e interpretar La desventaja principal del índice de Laspeyres es que se supone que las cantidades en el 
un índice de precios de periodo base aún son reales en el periodo dado. Es decir, las cantidades empleadas de los 

Paasche. seis artículos son casi las mismas en 1999 y 2009. En este caso observe que la cantidad de 

huevos comprados declinó 23%, mientras que la cantidad de leche aumentó casi 28% y el 
número de manzanas subió 33%. 

El índice de Paasche es una alternativa. El procedimiento es similar, pero en lugar de 
emplear cantidades del periodo base como ponderaciones, se utilizan cantidades del periodo 
actual. Se emplea la suma de los productos de los precios en 1999 y las cantidades en 2009. 
Esto tiene la ventaja de emplear las cantidades más recientes. Si hubiera un cambio en las 
cantidades consumidas desde el periodo base, se reflejaría en el índice Paasche. 


ÍNDICE DE PRECIOS DE PAASCHE 


P = 


ZPtQt 

2p 0 q, 


X 100 


(15-5) 


y 
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Cjemplo 

Solución 


Utilice la información de la tabla 15-3 para determinar el índice de Paasche. Analice cuál de los 
índices debe usar. 


Una vez más, debido a la naturaleza repetitiva de los cálculos, emplee Excel para realizar los 
cálculos. Los resultados se muestran en la siguiente captura de pantalla. 
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El índice de Paasche es 135.6, determinado por 


IPtQ, $811.60 

P = 2 p2 (100) = $598^6 (100) = 135 - 6 


Este resultado indica un aumento de 35.6% del precio de esta “canasta básica” de artícu- 
los entre 1999 y 2009. Es decir, cuesta 35.6% más comprar estos artículos en 2009 que en 
1999. El índice de Paasche refleja mejor la situación actual. Se debe observar que el índice de 
Laspeyres se emplea con más frecuencia debido a que hay menos datos que actualizar en 
cada periodo. El índice de Precios al Consumidor, que es el índice que se reporta con más fre- 
cuencia, es un ejemplo del índice de Laspeyres. 


¿Cómo decidir cuál índice se debe emplear? ¿Cuándo es más adecuado el índice de 
Laspeyres y cuándo lo es el de Paasche? 


Laspeyres 

Ventajas Requiere datos sobre cantidades sólo del periodo base, lo que permite 

una comparación más significativa en el transcurso del tiempo. Los cam- 
bios en el índice se pueden atribuir a cambios de precio. 

Desventajas No refleja cambios que el tiempo genera en los patrones de compra. 

Además, puede ponderar demasiado los artículos cuyos precios aumen- 
tan. 


Paasche 

Ventajas Como utiliza cantidades del periodo actual, refleja los hábitos actuales 

de compra. 

Desventajas Requiere datos de cantidades del año actual. Como se utilizan cantida- 
des diferentes cada año, es imposible atribuir cambios en el índice a 
cambios sólo en el precio. Tiende a ponderar demasiado los artículos 
cuyos precios declinaron. Necesita que los precios se vuelvan a calcular 
cada año. 
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índice ideal de Fisher 

El índice de Laspeyres tiende a ponderar demasiado los artículos cuyos precios aumentaron. 
Por otro lado, el de Paasche pondera demasiado los artículos cuyos precios disminuyeron. En 
un intento para compensar estas desventajas, Irving Fisher, en The Making of Index Numbers, 
publicado en 1922, propone un índice ideal de Fisher, compuesto por las medias geométri- 
cas de los índices de Laspeyres y Paasche. La media geométrica, descrita en el capítulo 3, se 
determina con la raíz /c-ésima del producto de k números positivos. 


índice ideal de Fisher = V(índice de Laspeyres)(índice de Paasche) (15-6) 


En teoría, el índice de Fisher parece ideal porque combina las mejores características de 
los índices de Laspeyres y Paasche. Es decir, equilibra los efectos de ambos índices. Sin 
embargo, casi no se utiliza en la práctica debido a que tiene el mismo conjunto básico de pro- 
blemas que el índice de Paasche. Es necesario determinar un conjunto nuevo de cantidades 
en cada periodo. 



Autoevaluación 15-2 



Se debe elaborar el índice de precios de ropa de 2009 con base en 2000. Las prendas que se con- 
sideran son zapatos y vestidos. Los precios y las cantidades de los dos años se dan en la siguiente 
tabla. Utilice 2000 como periodo base y 100 como valor base. 




2000 


2009 

Artículo 

Precio 

Cantidad 

Precio 

Cantidad 

Vestido (pieza) 

$75 

500 

$85 

520 

Zapatos (par) 

40 

1 200 

45 

1 300 


a) Determine el promedio simple de los índices de precios. 

b) Determine el índice de precios agregado de los dos años. 

c) Determine el índice de precios de Laspeyres. 

d) Determine el índice de precios de Paasche. 

e) Determine el índice de precios ideal de Fisher. 


comed; 


Ejercicios 

En los ejercicios 5 a 8: 

a) Determine los índices de precios simples. 

b) Determine el índice de precios agregado 
simple de los dos años. 

c) Determine el índice de precios de Laspeyres. 


d) Determine el índice de precios 
de Paasche. 

e) Determine el índice ideal de Fisher. 
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El índice de valores mide el 
cambio porcentual de un 
valor. 


OA5 Elaborar e interpretar 
un índice de valores. 


5. A continuación se presentan los precios de dentífrico (9 oz), champú (7 oz), pastillas para la tos 
(paquete de 100), y antitranspirante (2 oz) de agosto de 2000 y agosto de 2009. Además, se inclu- 
yen las cantidades compradas. Utilice agosto de 2000 como base. m 


Articulo 

Agosto de 2000 

Agosto de 2009 

Precio 

Cantidad 

Precio 

Cantidad 

Dentífrico 

$2.49 

6 

$3.35 

6 

Champú 

3.29 

4 

4.49 

5 

Pastillas para la tos 

1.59 

2 

4.19 

3 

Antitranspirante 

1.79 

3 

2.49 

4 


6. En la siguiente tabla se reportan los precios de frutas y las cantidades consumidas en 2000 y 2009. 
Utilice 2000 como base. 


Fruta 

2000 

2009 

Precio 

Cantidad 

Precio 

Cantidad 

Plátanos (libra) 

$0.23 

100 

$0.69 

120 

Toronja (pieza) 

0.29 

50 

1.00 

55 

Manzanas (libra) 

0.35 

85 

1.89 

85 

Fresas (canasta) 

1.02 

8 

3.79 

10 

Naranjas (saco) 

0.89 

6 

2.99 

8 


7. En la siguiente tabla se reportan los precios y los números de varios artículos que produce una 
máquina pequeña y una planta troqueladora. Utilice 2000 como base. 




2000 


2009 

Artículo 

Precio 

Cantidad 

Precio 

Cantidad 

Arandela 

$0.07 

17 000 

$0.10 

20 000 

Chaveta 

0.04 

125 000 

0.03 

130 000 

Perno 

para estufa 

0.15 

40 000 

0.15 

42 000 

Tuerca 

hexagonal 

0.08 

62 000 

0.10 

65 000 


8. Las siguientes son las cantidades y los precios de los años 2000 y 2009 de Kinzua Valley Geria- 
trics. Utilice 2000 como periodo base. m 




2000 


2009 

Artículo 

Precio 

Cantidad 

Precio 

Cantidad 

Jeringas (docena) 

$ 6.10 

1 500 

$ 6.83 

2 000 

Termómetros 

8.10 

10 

9.35 

12 

Analgésico Advil (frasco) 

4.00 

250 

4.62 

250 

Formas para historiales 
clínicos (caja) 

6.00 

1 000 

6.85 

900 

Papel para impresora (caja) 

12.00 

30 

13.65 

40 


15.7 índice de valores 

Un índice de valores mide cambios de precios y las cantidades implicadas. Un índice de valo- 
res, como el índice de ventas en tiendas departamentales, considera los precios del año base, 
las cantidades del año base, los precios del año actual y las cantidades del año actual para su 
elaboración. Su fórmula es: 


r 


INDICE DE VALORES 


v 


V = 


2 PtQt 
ZpoQo 


X 100 


(15-7) 


y 
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Cjemplo 


Solución 



Los precios y las cantidades que vendió Waleska Clothing Emporium de varias prendas de ves- 
tir en mayo de 2000 y mayo de 2009 son: 


Artículo 

Precio 
en 2000, 

Po 

Cantidad 
vendida 
en 2000 
(miles), 

Qo 

Precio 
en 2009, 

Pt 

Cantidad 
vendida 
en 2009 
(miles), 

Qt 

Corbatas (pieza) 

$ 1 

1 000 

$ 2 

900 

Trajes (pieza) 

30 

100 

40 

120 

Zapatos (par) 

10 

500 

8 

500 


¿Cuál es el índice de valores de mayo de 2009 con mayo de 2000 como periodo base? 

Las ventas totales en mayo de 2009 ascendieron a $1 0 600 000, y la cifra comparable de 2000 
es de $9 000 000. (Consulte la tabla 15-4.) Por lo tanto, el índice de valores de mayo de 2009 
con 2000 = 1 00 es 1 1 7.8. El valor de las ventas de ropa en 2009 fue 1 1 7.8% de las ventas en 
2000. En otras palabras, el valor de las ventas de ropa aumentó 17.8% de mayo de 2000 a 
mayo de 2009. 


V = 


s PtQt 
ZPoQo 


( 100 ) = 


$10 600 000 
$9 000 000 


(100) = 117.8 


TABLA 15-4 Elaboración de un índice de valores de 2009 (2000 = 100) 


Artículo 

Precio 
en 2000, 

Po 

Cantidad 
vendida 
en 2000 
(miles), 

Qo 

PoQo 

(miles de 
dólares) 

Precio 
en 2009, 

Pt 

Cantidad 
vendida 
en 2009 
(miles), 

Qt 

PtQt 
(miles 
de dólares) 

Corbatas (pieza 

$ 1 

1 000 

$1 000 

$ 2 

900 

$ 1 800 

Trajes (pieza) 

30 

100 

3 000 

40 

120 

4 800 

Zapatos (par) 

10 

500 

5 000 

8 

500 

4 000 




$9 000 



$10 600 



El número de artículos que produjo Houghton Products en 1996 y 2009, y los precios al mayoreo de 
los dos periodos son: 


Artículo producido 


Precio 

Número producido 

1996 

2009 

1996 

2009 

Pernos de tijeras (caja) 

$ 3 

$4 

10 000 

9 000 

Compuesto para corte 





(libra) 

1 

5 

600 

200 

Varillas de tensión (pieza) 

10 

8 

3 000 

5 000 


a) Encuentre el índice de valores de la producción de 2009 con 1996 como periodo base. 

b) Interprete el valor del índice. 


Ejercicios 


comed 


9. Los siguientes son los precios y la producción de granos en agosto de 1995 y agosto de 2009. 
a» 
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Grano 

Precio 
en 1995 

Cantidad 
producida 
en 1995 
(millones 
de bushels) 

Precio 
en 2009 

Cantidad 
producida 
en 2009 
(millones 
de bushels) 

Avena 

$1.52 

200 

$5.95 

214 

Trigo 

2.10 

565 

9.80 

489 

Maíz 

1.48 

291 

6.00 

203 

Cebada 

3.05 

87 

3.29 

106 


Con 1995 como periodo base, encuentre el índice de valores de los granos que se produjeron en 
agosto de 2009. 

10. Johnson Wholesale Company fabrica productos diversos. Los precios y las cantidades que pro- 
dujo en abril de 1994 y abril de 2009 son: 


Producto 

Precio 
en 1994 

Precio 
en 2009 

Cantidad 
producida 
en 1994 

Cantidad 
producida 
en 2009 

Motor pequeño (pieza) 

$23.60 

$28.80 

1 760 

4 259 

Compuesto depurador (galón) 

2.96 

3.08 

86 450 

62 949 

Clavos (libra) 

0.40 

0.48 

9 460 

22 370 


Con abril de 1994 como periodo base, encuentre el índice de valores de los artículos producidos 
en abril de 2009. 


15.8 índices para propósitos especiales 

Muchos índices importantes se elaboran y publican por organizaciones privadas. J.D. Power 
& Associates realiza encuestas entre compradores de automóviles para determinar la satisfac- 
ción de los clientes con sus vehículos después de un año de poseerlo. Este índice especial se 
denomina índice de Satisfacción del Consumidor. Con frecuencia, instituciones financieras, 
compañías de servicios y centros de investigación de universidades elaboran índices sobre el 
empleo, jornadas laborales y salarios, y ventas al menudeo de las regiones donde se ubican. 
Muchas asociaciones comerciales elaboran índices de precios y cantidades vitales de su área 
particular de interés. ¿Cómo se elaboran estos índices especiales? Un ejemplo, simplificado, 
por supuesto, ayudará a explicar algunos detalles. 
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Después de revisar y consultar los datos, el director asignó ponderaciones de 40% a las ven- 
tas de tiendas departamentales, 30% al empleo, 10% a los embarques en transportes de carga 
y 20% a las exportaciones. 

Para elaborar el índice General de Actividades de Negocios del Noroeste de 2009 con 
1999 = 100, cada valor de 2009 se expresa como porcentaje, con el valor del periodo base 
como denominador. Para ilustrar esta operación, las ventas de tiendas departamentales en 
2009 se convierten en porcentajes mediante ($44/$20)(1 00) = 220. Esto significa que las ven- 
tas de tiendas departamentales aumentaron 120% en el periodo. Luego, este porcentaje se 
multiplica por la ponderación apropiada. En el caso de las ventas de tiendas departamentales 
es (220)(0.40) = 88.0. Los detalles de los cálculos de 2004 y 2009 se muestran a continuación. 



2004 


2009 


Ventas de tiendas departamentales 

($41/$20)(100)(.40) = 

82.0 

($44/$20)(100)(.40) = 

88.0 

Empleo 

(110/1 00)(1 00)(.30) = 

33.0 

(125/1 00)(1 00)(.30) = 

37.5 

Embarques en transporte de carga 

(30/50)(100)(.10) = 

6.0 

(18/50)(1 00)(.10) = 

3.6 

Exportaciones 

(900/500)(100)(.20) = 

36.0 

(700/500)0 00)(.20) = 

28.0 

Total 


157.0 


157.1 


El índice General de Actividades de Negocios del Noroeste de 2004 es 1 57.0, mientras que 
el de 2009 es 157.1. La interpretación de estos índices es que la actividad de negocios aumen- 
tó 57.0% de 1999 a 2004, y 57.1% del periodo base de 1999 a 2009. 


Como ya se dijo al inicio de esta sección, hay muchos índices para propósitos especia- 
les. Los siguientes son algunos ejemplos. 


OA6 Explicar cómo se 
elabora y se interpreta el 
índice de Precios al 
Consumidor. 


índice de Precios al Consumidor 

La U.S. Bureau of Labor Statistics reporta este índice cada mes. Describe los cambios de pre- 
cios de un periodo a otro de una “canasta básica” de productos y servicios. En la siguiente 
sección se estudia su historia en detalle y se presentan algunas aplicaciones. Esta información 
está disponible en www.bls.gov, en Inflation and Consumer Spendig seleccione Consumer 
Pnce Index, luego haga clic en Get Detailed CPI Statistics, después seleccione All Urban 
Consumers (Current Series) y luego haga clic en U.S all Ítems 1982-1984 = 100. Quizá 
desee incluir periodos diferentes. El siguiente es un resumen de un informe reciente. 
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índice de Precios al Productor 

Lo publica la U.S. Bureau of Labor Statlstics; antes se denominaba índice de Precios al 
Mayoreo, que data de 1 890. Refleja los precios de más de 3 400 productos. Los datos de pre- 
cios se recopilan de los vendedores de los productos, y por lo general se refieren a la prime- 
ra transacción de gran volumen de cada producto. Es un índice tipo Laspeyres. Para consultar 
esta información, visite www.bls.gov, luego en Inflation and Consumer Spending, Producer 
Pnce Indexes, Get Detailed PPI Statistics, después, en Most Requested Statistics, selec- 
cione Commodity Data, y por último, Finished Goods. Quizá desee incluir periodos diferen- 
tes. La siguiente es una captura de pantalla reciente. 




Promedio Industrial Dow Jones (DJIA) 

Es un índice de precios accionarios, pero tal vez sería mejor llamarlo “indicador” en 
lugar de índice. Se supone que es el precio medio de 30 acciones industriales espe- 
cíficas. Sin embargo, al sumar los 30 precios accionarios y dividir entre 30 no se obtie- 
ne su valor. Esto se debe a las divisiones accionarias, a las fusiones y a la adición y 
eliminación de acciones. Cuando ocurre algún cambio, se hacen ajustes en el deno- 
minador empleado con el promedio. En la actualidad, el DJIA es más un indicador psi- 
cológico que una representación del movimiento general de precios en la Bolsa de 
Valores de Nueva York. La falta de representatividad de las acciones en el DJIA es una 
de las razones para el desarrollo del índice de la Bolsa de Valores de Nueva York. 
Este índice se desarrolló como un precio promedio de todas las acciones que se coti- 
zan en la bolsa de valores de esa ciudad. Puede encontrar más información sobre el 
DJIA en el sitio web www.dowjones.com: seleccione The Company, luego Dow 
Jones, y por último, en Enterprise Media Group, Dow Jones Indexes. Puede encon- 
trar su valor actual así como las 30 acciones que ahora son parte de su cálculo. En la 
siguiente gráfica se resume el DJIA de un día. Se puede localizar en el sitio web de 
Merrill Lynch: www.ml.com. 
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índice S&P 500 


Su nombre completo es índice Compuesto de Precios Accionarios de Standard & Poor’s. Se 
trata de un índice agregado de los precios de 500 acciones comunes. También es probable 
que sea un mejor reflejo del mercado que el DJIA. Puede acceder a la información de S&P 500 
en el sitio web de Merill Lynch. El siguiente es un resumen reciente. 


Merrill Lynch 
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Hay muchos otros índices que sirven para conocer el comportamiento económico y de 
negocios, como el Nasdaq, el Russell 2000 y el Wilshire 5000. 


N 

Como pasante en la Fulton County Economic Development Office, le piden desarrollar un índice 
para propósitos especiales de su condado. Tres series económicas parecen prometedoras como 
bases de un índice. Estos datos son el precio del algodón (por libra), el número de automóviles 
nuevos vendidos en el condado, y la tasa de movimientos de dinero (publicada por el banco local). 
Después de analizar el proyecto con su supervisor y el director, decide que la tasa de movimiento 
de dinero deberá tener una ponderación de 0.60, el número de automóviles nuevos vendidos, una 
ponderación de 0.30, y el precio del algodón, de 0.10. El periodo base es 1999. 
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Año 

Precio 
del algodón 

Automóviles 

vendidos 

Movimientos 
de dinero 

1999 

$0.20 

1 000 

80 

2004 

0.25 

1 200 

90 

2009 

0.50 

900 

75 


a) Elabore el índice de 2004 y 2009. 

b) Interprete el índice de 2004 y 2009. 


comed 


Ejercicios 

11. El índice de los principales indicadores económicos, compilado y publicado por el U.S. National 
Bureau of Economic Research, se compone de 12 series de tiempo, como las horas laborales pro- 
medio de producción en manufactura, los nuevos pedidos a los fabricantes y la oferta de dinero. 
Este índice y otros similares se diseñan para fluctuar hacia arriba o hacia abajo antes de que la 
economía cambie de igual forma. Con esta herramienta, un economista tiene evidencia estadísti- 
ca para predecir tendencias. 

Usted desea elaborar el indicador principal de Eñe County, en el norte de Nueva York. El índi- 
ce tendrá como base datos de 2000. Debido al tiempo y al trabajo implicado, decide emplear sólo 
cuatro series de tiempo. Como experimento, seleccione estas cuatro series: desempleo en el con- 
dado, el índice compuesto de precios accionarios del condado, el índice de Precios del Condado 
y las ventas al menudeo. Las siguientes son las cifras de 2000 y 2009. 



2000 

2009 

Tasa de desempleo 

5.3 

6.8 

Acciones compuestas del condado 

265.88 

362.26 

índice de Precios del Condado (1982 = 100) 

109.6 

125.0 

Ventas al menudeo (millones de dólares) 

529 917.0 

622 864.0 


Las ponderaciones que asigna son: tasa de desempleo 20%, precios accionarios 40%, índice de 
Precios del Condado 25% y ventas al menudeo 15%. 

a) Con 2000 como periodo base, elabore un indicador económico principal para 2009. 

b) Interprete su índice principal. 

12. Usted es empleado en la oficina estatal de desarrollo económico. Se necesita un índice económi- 
co principal para revisar la actividad económica pasada y para predecir las tendencias económicas 
que afectarán ai estado. Usted decide que se deben incluir varios factores claves: número de 
negocios nuevos iniciados durante el año, número de negocios fallidos, recibos de impuesto al 
ingreso en el estado, inscripciones en universidades y los recibos de los impuestos sobre las ven- 
tas en el estado. Éstos son los datos de 2000 y 2009. 



2000 

2009 

Negocios nuevos 

1 088 

1 162 

Negocios fallidos 

627 

520 

Recibos de impuestos al ingreso 



en el estado (en millones de dólares) 

191.7 

162.6 

Inscripciones en las universidades 

242 119 

290 841 

Impuesto sobre las ventas 



en el estado (en millones de dólares) 

41 .6 

39.9 


a) Establezca las ponderaciones que se van a aplicar a cada elemento del índice principal. 

b) Calcule el indicador económico principal de 2009. 

c) Interprete los índices. 
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Hay dos índices de precios al 
consumidor. 



Estadística en acción 

¿Da la impresión de que 
los precios sólo aumen- 
tan? El índice de Precios 
al Consumidor (IPC), 
calculado y reportado por 
el U.S. Department of 
Labor, es una medida 
relativa de cambios de 
precios. Proporciona 
información interesante 
sobre los precios en cate- 
gorías de productos y ser- 
vicios. Por ejemplo, 

¿sabía que el IPC mues- 
tra un decremento de 
2008 a 2009 de los pre- 
cios relativos de televiso- 
res, equipo de audio, 
computadoras y dispositi- 
vos periféricos? En reali- 
dad, con una base de 
1982-1984 = 100, el IPC 
de computadoras y perifé- 
ricos es 77.960. Esto sig- 
nifica que los precios 
relativos de computado- 
ras y periféricos disminu- 
yeron casi 22% con 
respecto a los precios de 
1982-1984. 



15.9 índice de precios 
al consumidor 

En las páginas anteriores se mencionó el índice de Precios al Consumidor (IPC). Este índice 
mide el cambio de precios de una canasta básica fija de bienes y servicios de un periodo a 
otro. En enero de 1978, el Bureau of Labor Statistics inició la publicación del IPC para dos gru- 
pos de la población. Un índice, denominado índice de Precios al Consumidor para todos los 
Consumidores Urbanos, cubre casi 87% de la población total. El otro índice es para los asa- 
lariados urbanos y trabajadores oficinistas, y cubre casi 32% de la población. 

En resumen, el IPC tiene varias funciones importantes. Permite que los consumidores 
determinen el grado en que se reduce su poder de compra debido a los incrementos de pre- 
cios. En ese sentido, es una medida para revisar salarios, pensiones y otros pagos de ingre- 
sos a fin de ir a la par con los cambios de precios. De igual importancia es un indicador 
económico de la tasa de inflación en Estados Unidos. 

Los índices incluyen casi 400 artículos, y cada mes cerca de 250 agentes recopilan datos 
de los precios en más de 21 000 establecimientos minoristas y 60 000 unidades residenciales 
en 91 áreas urbanas de Estados Unidos. Los precios de cunas para bebés, cerveza, puros, 
gasolina, corte de cabello, tasas de interés de hipotecas, honorarios médicos, impuestos y 
tarifas de quirófanos son sólo algunos de los artículos incluidos en lo que con frecuencia se 
conoce como “canasta básica” de los bienes y servicios que se adquieren. 

El IPC se originó en 1913 y se publica de forma regular desde 1921. El periodo estándar 
de referencia es 1982-1984. Los periodos base anteriores fueron: 1967, 1957-1959, 1947- 
1949, 1935-1939 y 1925-1929. ¿Por qué es necesario cambiar la base? Nuestros patrones de 
gasto cambian de forma dramática, y estos cambios se deben reflejar en el índice. La revisión 
más reciente incluye artículos como videocaseteras, computadoras caseras y teléfonos celu- 
lares. Las versiones anteriores del IPC no incluían estos artículos. Al cambiar la base, el IPC 
captura los patrones de gasto más recientes. Tal vez le convenga visitar www.bls.gov, hacer 
clic en Consumer Pnce Index y leer más al respecto. 

En realidad, el IPC no sólo es un índice: hay índices de Precios al Consumidor de Nueva 
York, Chicago, Seattle y Atlanta, así como de otras ciudades grandes. También hay índices de 
precios de alimentos, ropa, servicios médicos y otros artículos. Algunos de ellos se muestran 
a continuación, 1982-1984 = 100, de diciembre de 2009. 


Artículo 

IPC-U 

Todos los artículos 

215.949 

Alimentos y bebidas 

218.049 

Ropa 

119.357 

Transporte 

188.318 

Servicios médicos 

379.516 

Vivienda 

215.523 


Una lectura cuidadosa de esta lista muestra que un índice ponderado de todos los artícu- 
los aumentó 115.949% desde 1982-1984; los servicios médicos aumentaron más, 279.516%; 
y la ropa subió menos, 19.357%. 


Casos especiales del índice 
de Precios al Consumidor 


Además de medir los cambios de los precios de bienes y servicios, los dos índices de precios 
al consumidor tienen diversas aplicaciones. Con el IPC se determina el ingreso personal dis- 
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Ingreso real. 


Ingreso monetario. 


El ingreso deflacionado y el 
ingreso real son lo mismo. 



ponible, la deflación de las ventas u otras variables, el poder de compra del dólar y el aumen- 
to del costo de vida. Primero se analiza el uso del IPC para determinar el ingreso real. 

Ingreso real Como ejemplo del significado y cálculo del ingreso real, suponga que el índi- 
ce de Precios al Consumidor actual es 200 con 1982-1984 = 100. Además, suponga que la 
señora Watts ganó $20 000 por año en el periodo base de 1982, 1983 y 1984. Ella tiene un 
ingreso actual de $40 000. Observe que aunque su ingreso monetario aumentó al doble desde 
el periodo base de 1982-1984, los precios que pagó por alimentos, gasolina, ropa y otros ar- 
tículos también aumentaron el doble. Por lo tanto, el estándar de vida de la señora Watts per- 
maneció igual desde el periodo base hasta la actualidad. Los aumentos de precios 
compensaron exactamente el aumento del Ingreso, por lo que su poder de compra actual 
(ingreso real) aún es de $20 000. (Consulte la tabla 15-6 para los cálculos.) En general: 


r 


INGRESO REAL 




Ingreso real 


Ingreso monetario 
IPC 


x 100 


(15-8) 


TABLA 15-6 Cálculo del ingreso real en 1982-1984 y en el año en curso 


Año 

Ingreso 

monetario anual 

índice de Precios 
al Consumidor 
(1982-1984 = 100) 

Cálculo del 
ingreso real 

Ingreso real 

1982-1984 

$20 000 

100 

,2 r« 

$20 000 

Año en curso 

40 000 

200 


20 000 


Algunas veces, el concepto de ingreso real se denomina ingreso deflacionado, y el IPC se 
denomina índice de deflación. Además, un término popular para designar el ingreso deflacio- 
nado es ingreso expresado en dólares constantes. Así, en la tabla 15-6, para determinar si el 
estándar de vida de la señora Watts cambió, su Ingreso monetario se convirtió en dólares 
constantes. Se determinó que su poder de compra, expresado en dólares de 1982-1984 (dóla- 
res constantes), permaneció en $20 000. 


El salario neto de Jon Greene, y el IPC de 2000 y 2009 son: 


A 



Pago 

IPC 

Año 

neto 

(1982-1984 = 100) 

2000 

$25 000 

170.8 

2009 

41 200 

216.6 


a) ¿Cuál fue el ingreso real de Jon en 2000? 

b) ¿Cuál fue su ingreso real en 2009? 

c) Interprete sus resultados. 
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Las ventas deflacionadas son 
importantes para mostrar las 
tendencias en las ventas 
“reales”. 


Cjemplo 


Solución 




¿Qué sucedió con el poder de 
compra de su dinero? 


Ventas deflacionadas Un índice de precios también sirve para “deflacionar” las ventas o 
series monetarias similares. Las ventas deflacionadas se determinan mediante: 


USO DE UN ÍNDICE COMO 
FACTOR DE DEFLACIÓN 


w , ri . , Ventas reales 

Ventas deflacionadas = — — ; — ; — — 

Un índice apropiado 


x 100 


(15-9) 

J 


Las ventas de Hill Enterprises, pequeña compañía de moldeo por inyección al norte de Nueva 
York, aumentaron de $875 000 en 1982 a $1 482 000 en 1995, a $1 491 000 en 2000, a 
$1 502 000 en 2004, a $1 515 000 en 2007 y a $1 596 000 en 2009. El propietario, Harry Hill, 
se da cuenta de que el precio de la materia prima para el proceso también aumentó durante el 
mismo periodo, por lo que desea deflacionar las ventas para tomar en cuenta el aumento de 
precios de las materias primas. ¿Cuáles son las ventas deflacionadas de 1995, 2000, 2004, 
2007 y 2009 con base en dólares de 1982? Es decir, ¿cuáles son las ventas de 1995, 2000, 
2004, 2007 y 2009 expresadas en dólares constantes de 1982? 

El índice de Precios al Productor (IPP) es un índice que se publica cada mes en el Monthly 
Labor Review; también se encuentra disponible en el sitio web de la Bureau of Labor Statistics. 
Los precios del IPP reflejan los precios que paga el fabricante por metales, caucho y otros ar- 
tículos. Por lo tanto, parece un índice apropiado para deflacionar las ventas del fabricante. Las 
ventas del fabricante se presentan en la segunda columna de la tabla 15-7, y el IPP de cada 
año se encuentra en la tercera columna. En la siguiente columna se muestran las ventas divi- 
didas entre el IPP. En la columna de la derecha se dan los detalles de los cálculos. Los resul- 
tados se muestran en la siguiente captura de pantalla de Excel. 


TABLA 15-7 Cálculo de las ventas deflacionadas de Hill Enterprises 


Año 

Ventas 

IPP 

Dólares constantes 

Calculados por: 

1982 

$ 875 000.00 

100.0 

$ 875 000.00 

($ 875 000.00/1 00.0)*1 00.0 

1995 

1 482 000.00 

127.9 

1 158 717.75 

($1 482 000.00/127.9)*100.0 

2000 

1 491 000.00 

139.0 

1 072 661.87 

($1 491 000.00/139.01*100.0 

2004 

1 502 000.00 

148.5 

1 011 447.81 

($1 502 000.00/148.41*100.0 

2007 

1 515 000.00 

166.6 

909 363.75 

($1 515 000.00/166.61*100.0 

2009 

1 596 000.00 

172.5 

925 217.39 

($1 596 000.00/172.51*100.0 


Las ventas aumentaron de 1995 a 2009, pero si compara las ventas en dólares constan- 
tes, declinaron durante el periodo. Es decir, las ventas deflacionadas sumaron $1 072 661 .87 
en 2000, pero declinaron a $1 011 477.81 en 2004. En 2007 declinaron aún más, hasta 
$909 363.75. Esto se debe a que los precios que pagó Hill Enterprises por materias primas 
aumentaron más rápido que las ventas. Entonces, en 2009 las ventas deflacionadas aumenta- 
ron con respecto al nivel de 2007. 


Poder de compra del dólar Con el Índice de Precios al Consumidor también se deter- 
mina el poder de compra del dólar. 


USO DE UN ÍNDICE PARA DETERMINAR $i 

Poder de compra del dólar = — x 100 (15-10) 
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El IPC se usa para ajustar Ajustes del costo de vida El índice de Precios al Consumidor (IPC) también es la base 

salarios, pensiones, etcétera. para realizar ajustes del costo de vida (COLA, en inglés), en muchos contratos entre empresas 

y sindicatos. Con frecuencia, a la cláusula específica del contrato se le denomina “cláusula 
escaladora”. Cerca de 31 millones de beneficiarios de la seguridad social, 2.5 millones de mili- 
tares y empleados del servicio civil federal jubilados y pensionistas, y 600 000 trabajadores del 
servicio postal tienen sus ingresos o pensiones basadas en el IPC. 

Este índice también se utiliza para ajustar los pagos de pensión alimentaria y manuten- 
ción; honorarios de abogados; pagos de compensaciones a trabajadores; rentas de departa- 
mentos, casas y edificios de oficinas; pagos del seguro de desempleo, etc. En resumen, 
digamos que una persona jubilada recibe una pensión de $500 al mes y el IPC aumenta 5 pun- 
tos de 165 a 170. Suponga que por cada punto de aumento del IPC los beneficios de la pen- 
sión aumentan 1.0%; por lo tanto, el aumento mensual de los beneficios será de $25, 
determinado por $500 (5 puntos)(0.01). Ahora la persona jubilada recibirá $525 al mes. 



15.10 Cambio de base 

Si dos o más series tienen el mismo periodo base, se pueden comparar de manera directa. 
Como ejemplo, suponga que tiene interés en la tendencia de los precios de alimentos y bebi- 
das, vivienda, servicios médicos, etc., desde el periodo base, 1982-1984. Observe en la tabla 
15-8 que en todos los índices de precios al consumidor se utiliza la misma base. De aquí, se 


TABLA 15-8 Tendencia de los precios al consumidor hasta 2009 (1982-1984 = 100) 


Año 

Todos los 
artículos 

Alimentos 
y bebidas 

Vivienda 

Ropa y 
manutención 

Servicios 

médicos 

1982-1984 100.0 

100.0 

100.0 

100.0 

100.0 

1990 

130.7 

132.1 

128.5 

124.1 

162.8 

1995 

152.4 

148.9 

148.5 

132.0 

220.5 

2000 

172.2 

168.4 

169.6 

129.6 

260.8 

2004 

188.9 

186.6 

189.5 

120.4 

310.1 

2005 

195.3 

191.2 

195.7 

119.5 

323.2 

2007 

207.392 

203.300 

209.586 

118.257 

369.302 

2009 

214.537 

218.249 

217.057 

120.078 

375.613 
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concluye que el precio de todos los artículos para el consumidor combinados aumentaron 
114.537% desde el periodo base (1982-1984) hasta 2009. (Desde enero de 2007, el IPC se 
reporta con tres decimales en vez de uno.) De igual forma, los precios de las viviendas aumen- 
taron 117.057%, los servicios médicos 375.613%, y así sucesivamente. 

Sin embargo, surge un problema cuando dos o más series que se comparan no tienen el 
mismo periodo base. En el siguiente ejemplo se comparan los dos índices de negocios que se 
reportan con más frecuencia, el DJIA y el Nasdaq. 


Cjemplo 


Solución 


Quiere comparar los cambios de precios en el Promedio Industrial Dow Jones (DJIA) con el 
Nasdaq. Los índices de los periodos seleccionados desde 1995 son los siguientes. La infor- 
mación se reporta el 1 de julio de cada año. 


Fecha 


DJIA 


Nasdaq 

l-Jul-95 

4 

708.47 

1 

001.21 

l-Jul-00 

10 

521.98 

3 

766.99 

l-Jul-01 

10 

522 . 81 

2 

027 . 13 

l-Jul-02 

8 

736 . 59 

1 

328.26 

l-Jul-03 

9 

233 .80 

1 

735 . 02 

l-Jul-04 

10 

139.71 

1 

887.36 

l-Jul-05 

10 

640 . 91 

2 

184.83 

l-Jul-06 

11 

228 . 02 

2 

190.43 

l-Jul-07 

13 

535.43 

2 

632.30 

l-Jul-08 

11 

382.26 

1 

875.42 

l-Jul-09 

8 

504 . 06 

1 

845 . 72 


A partir de esta información, no existe la certeza de que los periodos base sean los mismos. 
De aquí que no sea posible una comparación apropiada. Como desea comparar los cambios 
que sufrieron los dos índices de negocios, el enfoque lógico es dejar que un año en particular, 
digamos 1995, sea la base de los dos índices. En el caso del DJIA la base es 4 708.47, y en el 
de Nasdaq, 1 001.21. 

El cálculo del índice del DJIA en 2005 es: 

10 640.91 

Indice = — — — — — (100) = 226.0 
4 708.47 v ' 

En la siguiente captura de pantalla de Excel se reporta el conjunto completo de índices. 

Comparación entre DJIA y Nasdaq 


Fecha 

l-Jul-95 

DJIA í 
4 708.47 

indice 

100 . 0 

NASDAQ í 
1 001.21 

índice 

100 . 0 

l-Jul-00 

10 521.98 

223.5 

3 766.99 

376.2 

l-Jul-01 

10 522.81 

223.5 

2 027.13 

202 . 5 

l-Jul-02 

8 736.59 

185.6 

1 328.26 

132 . 7 

l-Jul-03 

9 233.80 

196.1 

1 735.02 

173.3 

l-Jul-04 

10 139.71 

215.4 

1 887.36 

188.5 

l-Jul-05 

10 640.91 

226 . 0 

2 184.83 

218.2 

i-jui-oe 

11 228.02 

238.5 

2 190.43 

218 . 8 

l-Jul-07 

13 535.43 

287.5 

2 632.30 

262 . 9 

l-Jul-08 

11 382.26 

241 . 7 

2 304.97 

230.2 

l-Jul-09 

8 504.06 

180 . 6 

1 845.72 

184 . 3 


Se concluye que los dos índices aumentaron durante este periodo. El DJIA subió 187.5% 
y el Nasdaq 162.9% del 1 de julio de 1995 al 1 de julio de 2007. Observe que ambos índices 
alcanzaron un máximo en 2000, declinaron a su punto más bajo en 2002 y aumentaron hasta 
2007. Ambos índices declinaron en 2008 y 2009. 

La siguiente información, que se obtuvo de la sección financiera de Yahoo!, está conteni- 
da en una gráfica lineal del DJIA y Nasdaq. En el eje vertical se muestra el cambio porcentual 
desde el periodo base de junio de 2003 de los dos índices. A partir de esta gráfica se conclu- 
ye que ambos alcanzaron su incremento porcentual más grande a finales de 2007, y después 
declinaron en 2008 y 2009. Por supuesto, si selecciona periodos distintos como base, los 
resultados quizá no sean exactamente iguales. 



15.10 Cambio de base 
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Autoevaluación 15-7 



a) A partir del ejemplo anterior, verifique que el índice de precios DJIA de 2004, con 1995 como 
periodo base, sea 215.4. 

b) Se desea comparar los cambios en la producción industrial y en los precios que pagaron los 
fabricantes por materias primas desde 1982. Desafortunadamente, el índice de la producción 
industrial, que mide los cambios en la producción, y el índice de Precios del Productor, que mide 
los cambios de precios de las materias primas, tienen periodos base distintos. El índice de pro- 
ducción tiene como periodo base 2002, y el Indice de Precios al Productor, 1982. Cambie la base 
a 2002 y haga comparables ambas series. Interprete sus resultados. 


Año 

índice de 
Producción 
Industrial 
(2002 = 100) 

índice de 
Precios al 
Productor 
(1982 = 100) 

2004 

103.8 

159.1 

2005 

107.2 

182.3 

2006 

109.7 

185.0 

2007 

111.3 

206.9 

2008 

108.8 

251.0 


comed: 


Ejercicios 

13. En abril de 2008, el salario medio de una supervisora de enfermeras con licenciatura fue $89 673. 
El índice de Precios al Consumidor de abril de 2009 fue 213.240 (1982-1984 = 100). El salario 
medio anual de una enfermera en el periodo base de 1982-1984 fue $19 800. ¿Cuál fue el ingreso 
real de la enfermera en abril de 2009? ¿Cuánto aumentó el salario medio? 

14. La Trade Union Association of Orlando, Florida, mantiene índices sobre los salarios por hora de 
diversos oficios. Desafortunadamente, no todos los índices tienen el mismo periodo base. A con- 
tinuación se presenta la información sobre plomeros y electricistas. Cambie los periodos base a 
2000 y compare los aumentos de los salarios por hora de 2000 a 2009. 


Año 

Plomeros (1995 = 100) 

Electricistas (1998 = 100) 

2000 

133.8 

126.0 

2009 

159.4 

158.7 
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15. En 1995, el salario medio de los maestros del Tinora School District fue de $28 650. En 2004, 
aumentó a $33 972, y en 2009 aún más, a $37 382. La American Federation of Classroom Teachers 
recolecta información sobre las tendencias de los salarios de maestros en Estados Unidos. Su 
índice, cuyo periodo base es 1995, fue 122.5 en 2004 y 136.9 en 2009. Compare los salarios de 
los maestros del distrito de Tinora con las tendencias nacionales. 

16. Sam Steward es un diseñador de páginas web que trabaja de manera independiente. En la siguien- 
te tabla se pueden observar sus salarios anuales durante varios años entre 2002 y 2008. En la tabla 
también se incluye un índice industrial de diseñadores de páginas web que reporta la tasa de infla- 
ción de los salarios en la industria. Este índice tiene a 1995 como periodo base. 


Año 

Salario (en miles 
de dólares) 

índice (1995 = 100) 

2002 

134.8 

160.6 

2004 

145.2 

173.6 

2006 

156.6 

187.9 

2008 

168.8 

203.3 


Calcule el ingreso real de Sam en los años seleccionados durante el periodo de seis años. ¿Van a 
la par sus salarios con la inflación o ha perdido ingresos? 



Estadística en acción 

En la década de 1920, en 
Alemania, los precios al 
mayoreo aumentaron de 
forma drástica. En 1920, 
crecieron casi 80%, en 
1921 la tasa aumentó a 
140%, y en 1922 fue un 
sorprendente 4 100%. 
Entre diciembre de 1922 
y noviembre de 1923 los 
precios al mayoreo 
aumentaron otro 4 100%. 
En esa época, las prensas 
de impresión de papel 
dinero no podían mante- 
ner ese ritmo, ni siquiera 
con billetes con denomi- 
naciones tan grandes 
como 500 millones de 
marcos. Se cuenta que a 
los trabajadores se les 
pagaba todos los días, y 
luego dos veces al día, 
para que sus esposas 
pudieran hacer sus com- 
pras antes de que sus 
salarios se devaluaran 
demasiado. 


Resumen del capítulo 


I. Un número índice mide un cambio relativo de un periodo a otro. 

A. Las características importantes de un índice son: 

1. Es un porcentaje, pero en general se omite el signo de porcentaje. 

2. Se refiere a un periodo base. 

3. La mayoría de los índices se reportan hasta el décimo más cercano, como 153.1. 

4. La base de la mayoría de los índices es 100. 

B. Las razones para calcular un índice son: 

1. Facilita la comparación de series desiguales. 

2. Si los números son muy grandes, con frecuencia es más fácil comprender el cambio del 
índice que las cifras reales. 

II. Hay dos tipos de índices de precios: ponderados y no ponderados. 

A. En un índice no ponderado, no se consideran las cantidades. 

1. En un índice simple se compara el periodo base con el periodo dado. 


P = ^x 
Po 


100 


(15-1) 


donde p f se refiere al precio del periodo actual, y p 0 es el precio del periodo base. 

2. En el promedio simple de los índices de los precios, se suman los índices simples de cada 
artículo y el resultado se divide entre el número de artículos. 

n 


P = 


(15-2) 


3. En un índice de precios agregado simple, el precio de los artículos del grupo que se consi- 
dera de los dos periodos se suman y se comparan. 

2p, 


P = 


2Po 


X 100 


(15-3) 


B. En un índice ponderado se consideran las cantidades. 

1. Cuando se emplea el método de Laspeyres se utilizan las cantidades del periodo base 
tanto en el periodo base como en el dado. 


P = 


2PtQo 

SPoQo 


X 100 


2. En el método de Paasche se utilizan las cantidades del periodo actual. 

2PtPt 

2p 0 q, 


p= spa x 10Q 


(15-4) 


(15-5) 
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3. El índice de precios ideal de Fisher es la media geométrica del índice de Laspeyres y del 
índice de Paasche. 

Indice ideal de Fisher = V(índice de Laspeyres)(índice de Paasche) (15-6) 

C. En el índice de valores se contemplan los precios y las cantidades del periodo base y del perio- 
do actual. 

V= ^ P ‘ qt X 100 (15-7) 

SPoQo 

III. El índice que se reporta con más frecuencia es el índice de Precios al Consumidor (IPC). 

A. Se utiliza con frecuencia para mostrar la tasa de inflación en Estados Unidos. 

B. Lo elabora mensualmente el U.S. Bureau of Labor Statistics. 

C. El periodo base actual es 1982-1984. 

D. Se utiliza por el sistema de seguridad social, por lo que, cuando el IPC cambia, también lo hace 
el monto de las pensiones. 


comect 


Ejercicios del capítulo 

La siguiente información se obtuvo de los reportes anuales de Johnson & Johnson. La oficina matriz de 
la empresa se encuentra en New Brunswick, Nueva Jersey. Sus acciones comunes se cotizan en la 
Bolsa de Valores de Nueva York, con el símbolo JNJ. 


Año 

Ventas 
nacionales 
(en millones 
de dólares) 

Ventas 

internacionales 
(en millones 
de dólares) 

Ventas totales 
(en millones 
de dólares) 

Empleados 
(en miles) 

2000 

17 316 

11 856 

29 172 

100.9 

2001 

19 825 

12 492 

32 317 

101.8 

2002 

22 455 

13 843 

36 298 

108.3 

2003 

25 274 

16 588 

41 862 

110.6 

2004 

27 770 

19 578 

47 348 

109.9 

2005 

28 377 

22 137 

50 514 

115.6 

2006 

29 775 

23 549 

53 324 

122.2 

2007 

32 444 

28 651 

61 095 

119.2 

2008 

32 309 

31 438 

63 747 

118.7 

2009 

30 889 

31 008 

61 897 

115.5 


17. Consulte los datos de Johnson & Johnson. Utilice 2000 como periodo base y calcule un índice 
simple de las ventas nacionales de cada año desde 2000 hasta 2009. Interprete la tendencia de 
las ventas nacionales. 

18. Consulte los datos de Johnson & Johnson. Utilice el periodo 2000-2002 como periodo base y cal- 
cule un índice simple de las ventas nacionales de cada año de 2003 a 2009. 

19. Consulte los datos de Johnson & Johnson. Utilice 2000 como periodo base y calcule un índice 
simple de las ventas internacionales de cada año de 2001 a 2009. Interprete la tendencia de las 
ventas internacionales. 

20. Consulte los datos de Johnson & Johnson. Utilice el periodo 2000-2002 como periodo base y cal- 
cule un índice simple de las ventas internacionales de cada año de 2003 a 2009. 

21. Consulte los datos de Johnson & Johnson. Utilice 2000 como periodo base y calcule un índice 
simple del número de empleados de cada año de 2001 a 2009. Interprete la tendencia del núme- 
ro de empleados. 

22. Consulte los datos de Johnson & Johnson. Utilice el periodo 2000-2002 como periodo base y cal- 
cule un índice simple del número de empleados de cada año de 2003 a 2009. 

La siguiente información proviene de los reportes anuales de la General Electric Corporation (GE). 


Año 

Ingreso (en millones 
de dólares) 

Empleados 
(en miles) 

2004 

134 

325 

2005 

152 

307 

2006 

157 

316 


Año 

Ingreso (en millones 
de dólares) 

Empleados 
(en miles) 

2007 

168 

319 

2008 

177 

327 

2009 

183 

323 
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23 . Calcule un índice simple del ingreso de la GE. Utilice 2004 como periodo base. ¿Qué puede con- 
cluir acerca del cambio en el ingreso durante el periodo dado? 

24 . Calcule un índice simple del ingreso de la GE con el periodo 2004-2006 como base. ¿Qué puede 
concluir acerca del cambio en el ingreso durante el periodo dado? 

25 . Calcule un índice simple del número de empleados de la GE. Utilice 2004 como periodo base. 
¿Qué puede concluir acerca del cambio en el número de empleados de la GE durante este pe- 
riodo? 

26 . Calcule un índice simple del número de empleados de la GE del periodo 2004-2006 como base. 
¿Qué puede concluir acerca del cambio en el número de empleados durante este periodo? 

La siguiente tabla tiene información sobre artículos de alimentos en 2000 y 2009. 


Artículo 

2000 

2009 

Precio 

Cantidad 

Precio 

Cantidad 

Margarina (libra) 

$0.81 

18 

$2.00 

27 

Manteca (libra) 

0.84 

5 

1.88 

9 

Leche (1/2 galón) 

1.44 

70 

2.89 

65 

Papas (libra) 

2.91 

27 

3.99 

33 


27 . Calcule un índice de precios simple de cada uno de los cuatro artículos. Utilice 2000 como perio- 
do base. 

28 . Calcule un índice de precios agregado simple. Utilice 2000 como periodo base. 

29 . Calcule el índice de precios de Laspeyres de 2009 con 2000 como periodo base. 

30 . Calcule el índice de Paasche de 2009 con 2000 como periodo base. 

31 . Determine el índice ideal de Fisher con los valores de los índices de Laspeyres y Paasche calcu- 
lados en los dos problemas anteriores. 

32 . Determine el índice de valores de 2009 con 2000 como periodo base. 

Betts Electronics compra tres partes de repuesto para máquinas robóticas que utiliza en su proceso de 
manufactura. A continuación se da la información del precio de las partes de repuesto y la cantidad que 
compró. 


Parte 

Precio 

Cantidad 

2000 

2009 

2000 

2009 

RC-33 

$0.50 

$0.60 

320 

340 

SM-14 

1.20 

0.90 

110 

130 

WC50 

0.85 

1.00 

230 

250 


33. Calcule un índice de precios simple de cada uno de los tres artículos. Utilice 2000 como periodo 



34 . Calcule un índice de precios agregado simple de 2009. Utilice 2000 como periodo base. 

35 . Calcule el índice de precios de Laspeyres de 2009 con 2000 como periodo base. 

36 . Calcule el índice de Paasche de 2009 con 2000 como periodo base. 

37 . Determine el índice ideal de Fisher con los valores de los índices de Laspeyres y Paasche calcu- 
lados en los dos problemas anteriores. 

38 . Determine un índice de valores de 2009 con 2000 como periodo base. 

En la siguiente tabla se dan los precios de ciertos alimentos en 2000 y 2009. 


Artículo 

Precio 

Cantidad 

2000 

2009 

2000 

2009 

Col (libra) 

$0.06 

$0.05 

2 000 

1,500 

Zanahorias (racimo) 

0.10 

0.12 

200 

200 

Chícharos (cuarto) 

0.20 

0.18 

400 

500 

Endivia (racimo) 

0.15 

0.15 

100 

200 
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39 . Calcule un índice de precios simple para cada uno de los artículos. Utilice 2000 como periodo 



40 . Calcule un índice de precios agregado simple. Utilice 2000 como periodo base. 

41 . Calcule el índice de precios de Laspeyres de 2009 con 2000 como periodo base. 

42 . Calcule el índice de Paasche de 2009 con 2000 como periodo base. 

43 . Determine el índice ideal de Fisher con los valores de los índices de Laspeyres y Paasche que se 
calcularon en los dos ejemplos anteriores. 

44 . Determine un índice de valores de 2009 con 2000 como periodo base. 

En la siguiente tabla se presentan los precios de ciertos artículos en 1990 y 2009. Además, se propor- 
cionan las cifras de la producción de ambos periodos. 


Artículo 

Precio 

Cantidad 

1990 

2009 

1990 

2009 

Aluminio (centavos por libra) 

$ 0.287 

$ 0.76 

1 000 

1 200 

Gas natural (1 000 pies cúbicos) 

0.17 

2.50 

5 000 

4 000 

Petróleo (barril) 

3.18 

26.00 

60 000 

60 000 

Platino (onza troy) 

133.00 

490.00 

500 

600 


45 . Calcule un índice de precios simple de cada uno de los cuatro artículos. Utilice 1990 como perio- 
do base. 

46 . Calcule un índice de precios agregado simple. Utilice 1990 como periodo base. 

47 . Calcule el índice de precios de Laspeyres de 2009 con 1990 como periodo base. 

48 . Calcule el índice de precios de Paasche de 2009 con 1990 como periodo base. 

49 . Determine el índice ideal de Fisher con los valores de los índices de Laspeyres y Paasche que se 
calcularon en los dos problemas anteriores. 

50 . Determine un índice de valores de 2009 con 1990 como periodo base. 

51 . Se diseñará un índice para propósitos especiales para vigilar la economía global del suroeste de 
Estados Unidos. Se seleccionaron cuatro series claves. Después de una deliberación considera- 
ble se decidió ponderar las ventas al menudeo 20%, los depósitos bancarios totales 10%, la pro- 
ducción industrial en el área 40%, y el empleo en el área no agrícola 30%. Los datos de 1996 y 
2009 son los siguientes: 


Año 

Ventas 
al menudeo 
(en millones 
de dólares) 

Depósitos 
bancarios (en 
miles de millones 
de dólares) 

Producción 
industrial 
(1990 = 100) 

Empleo 

1996 

1 159.0 

87 

110.6 

1 214 000 

2009 

1 971.0 

91 

114.7 

1 501 000 


Elabore un índice para propósitos especiales de 2009 con 1996 como periodo base, e interprete 
su resultado. 

52 . Se realizó un estudio histórico de la economía estadounidense de 1950 a 1980, para lo cual se 
recopilaron datos sobre precios, fuerza de trabajo, productividad y PIB. Observe en la siguiente 
tabla que el IPC tiene 1967 como periodo base, el empleo está en millones de personas, etc. Por 
lo tanto, no es posible una comparación directa. 

a) Realice los cálculos necesarios para comparar la tendencia en las cuatro series de 1 950 a 1 980. 
¿>) Interprete sus resultados. 


Año 

índice de 
Precios al 
Consumidor 
(1967 = 100) 

Fuerza 

laboral 

total 

(millones) 

índice de 
productividad 
en la manufactura 
(1967 = 100) 

Producto 
Interno 
Bruto (miles 
de millones 
de dólares) 

1950 

72.1 

64 

64.9 

286.2 

1967 

100.0 

81 

100.0 

789.6 

1971 

121.3 

87 

110.3 

1 063.4 

1975 

161.2 

95 

114.9 

1 516.3 

1980 

246.8 

107 

146.6 

2 626.0 
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53. La gerencia de las tiendas Ingalls Super Discount, con varios locales en el área de Oklahoma City, 
desea elaborar un índice de la actividad económica del área metropolitana. La gerencia está de 
acuerdo en que, si el índice revela una economía en receso, el inventario se deberá mantener en 
un nivel bajo. 

Tres series parecen prometedoras como factores de predicción de la actividad económica: las 
ventas al menudeo en el área, los depósitos bancarios y el empleo. Todos estos datos se pueden 
obtener del gobierno de Estados Unidos. Las ventas al menudeo tendrán una ponderación de 
40%, los depósitos bancarios, 35%, y el empleo, 25%. Los datos ajustados por temporada del pri- 
mer trimestre del año son: 


Mes 

Ventas al 

menudeo (millones) 

Depósitos bancarios 
(miles de millones) 

Empleo 

(miles) 

Enero 

8.0 

20 

300 

Febrero 

6.8 

23 

303 

Marzo 

6.4 

21 

297 


Elabore un índice de la actividad económica de cada uno de los tres meses, con enero como perio- 
do base. 

54. En la siguiente tabla se da la información sobre el índice de Precios al Consumidor y el ingreso 
neto mensual de Bill Martin, empleado de Jeep Corporation. 



índice de Precios al 

Ingreso neto 

Año 

Consumidor (1982-1984 = 100) 

mensual de Martin 

1982-1984 

100.0 

$ 600 

2009 

214.537 

2 000 


a) ¿Cuál es el poder de compra del dólar en 2009 con base en el periodo 1982-1984? 

b) Determine el ingreso mensual “real” de Martin en 2009. 

55. Suponga que el índice de Precios al Productor y las ventas de Hoskin’s Wholesale Distributors de 
1995 y 2009 son: 


Año 

índice de Precios al Productor 

Ventas 

1995 

127.9 

$2 400 000 

2009 

172.5 

3 500 000 


¿Cuáles son las ventas reales (o ventas deflacionadas) de Hoskin’s en los dos años? 


Comandos de software 


1. Los comandos en Excel de la hoja de cálculo de la página 

582 son: 

a) Escriba los datos de los precios y las cantidades. 
Ingrese el identificador Item en la celda A2, y los nom- 
bres de los artículos, en las celdas A3 a A8. El identifica- 
dor 1999 Price se ingresó en B2, y los datos de los 
precios de 1999, en las celdas B3 a B8. El identificador 
1999 Quantity se ingresó en la celda C2, con las canti- 
dades de 1999 en las celdas C3 a C8. La celda E2 se 
identificó 1999 Príce*1999 Quantity. 

b) Para determinar el producto de los precios de 1 999 y las 
cantidades, resalte la celda E3. Escriba = B2*C2 en la 
celda E3 y presione Enter. Deberá aparecer el valor 


43.5. Éste es el producto del precio del pan ($0.87) por 
la cantidad de pan (50) que se vendió en 1999. 

c) Con la celda E3 aún resaltada, mueva el cursor al ángu- 
lo inferior derecho de la celda E3, oprima el botón 
izquierdo del mouse y arrastre la celda hacia abajo hasta 
la celda E8. Deberán aparecer los productos restantes. 

d) Pase a la celda E9, haga clic en 2, en la barra de herra- 
mientas, y presione Enter. Aparecerá el valor 507.64. 
Éste es el denominador del índice de precios de 
Laspeyres. Los demás productos y totales de las colum- 
nas se determinan de manera similar. La otra captura de 
pantalla de Excel en el capítulo se calcula de manera 
semejante. 


Respuestas a las autoevaluaciones 
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b) La actividad comercial aumentó 16% de 1999 a 2004. 
Aumentó 8.25% de 1999 a 2009. 

a) $14 637, determinado por ($25 000/1 70.8)(1 00). 

b) $19 021 , determinado por ($41 200/21 6.6)(1 00). 

c) En términos del periodo base, el salario de Jon fue de 
$14 637 en 2000 y de $19 021 en 2009. Esto indica 
que su ingreso neto aumentó con una tasa mayor que 
el precio de alimentos, transporte, etcétera. 

$0.51, determinado por ($1.00/1 95. 4)(1 00). El poder de 
compra disminuyó $0.49. 

a) 215.4, determinado por (10 139.71/4 708.47)(1 00). 

b) Con 2004 como periodo base de las dos series: 


De ia base de 2004, el índice de precios al productor 
de las materias primas aumentó a una tasa mayor 
(57.76%) que la producción industrial (4.82%). 


b) El valor de las ventas aumentó 27.1% de 1996 a 2009. 


En 2004 

Artículo 

Ponderación 


Algodón 

($0.25/$0.20)(1 00)(.1 0) 

= 12.5 

Automóviles 

(1 ,200/1 ,000)(100)(.30) 

= 36.0 

Cambio de dinero 

(90/80)(100)(.60) 

= 67.5 



116.0 



índice de 
Producción 
Industrial 

índice de Precios 
al Productor 

2004 

1.0000 

1 .0000 

2005 

1.0328 

1.1458 

2006 

1.0568 

1.1628 

2007 

1.0723 

1 .3004 

2008 

1.0482 

1 .5776 


En 2009 

Artículo 

Ponderación 


Algodón 

($0.50/$0.20)(1 00)(.1 0) 

= 25.00 

Automóviles 

(900/1 ,000)(100)(.30) 

= 27.00 

Cambio de dinero 

(75/80)(100)(.60) 

= 56.25 
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15-1 1. 


2 . 


Nación 

AMT 

índice 


China 

500.5 

547.59 


Unión Europea 

198.0 

216.63 


Japón 

118.7 

129.87 


Estados Unidos 

91.4 

100.00 


Rusia 

68.5 

74.95 


China produce 447.6% más acero que Estados 

Jnidos. 




Ingreso promedio 

(a) 

(b) 

Año 

por hora 

índice 

índice 

1995 

11.65 

100.0 

90.8 

2000 

14.02 

120.3 

109.2 

2005 

16.13 

138.5 

125.7 

2010 (May) 

19.01 

163.2 

148.1 


15-5 


15-2 a) P, = ($85/$75)(1 00) = 113.3 
P 2 = ($45/$40)(1 00) = 112.5 
P = (113.3 + 1 12.5)/2 = 112.9 
P = ($1 30/$1 1 5)(1 00) = 113.0 
$85(500) + $45(1 200) 


15-6 

15-7 


b) 

c) 


P = 


$75(500) 
$96 500 


$40(1 200) 
(100) = 112.9 


( 100 ) 


d) P = 


85 500 
$85(520) + $45(1 300) 


$75(520) 
$102 700 


f $40(1 300) 
(100) = 112.9 


( 100 ) 


e) 

15-3 a) 


$91 000 
P = V(112.9)(112.9) = 112.9 

$4(9 000) + $5(200) + $8(5 000) 


P = 


$3(10 000) + $1(600) + $10(3 000) 
$77 000 


( 100 ) 


60 600 


(100) = 127.1 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Definir los componentes 
de una serie de tiempo. 



f 

Series de tiempo 
y proyección 


OA2 Calcular un promedio 
móvil. 

OA3 Determinar una 
ecuación de tendencia lineal. 

OA4 Utilizar la ecuación de la 
tendencia para calcular 
proyecciones. 

OA5 Calcular una ecuación 
de tendencia no lineal. 

OA6 Determinar e Interpretar 
un conjunto de índices 
estacionales. 

OA7 Desestaclonal ¡zar datos 
mediante un índice estacional. 

OA8 Calcular proyecciones 
estaclonalmente ajustadas. 

OA9 Probar la 
autocorrelaclón. 



Team Sports, Inc., vende artículos deportivos a preparatorias y 
universidades por medio de un catálogo de distribución nacional. La 
gerencia de la empresa estima que venderá 2 000 guantes de 
“catcher” marca Wllson Modelo A2000 el próximo año. Las ventas 
desestacionallzadas proyectadas serán ¡guales en cada uno de los 
cuatro trimestres el año próximo. El factor estacional del segundo 
trimestre es 145. Determine las ventas ajustadas por temporada en el 
segundo trimestre del próximo año. (Vea ejercicio 12, objetivo 8.) 
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16.1 Introducción 

¿Qué es una serie de tiempo? En este capítulo se efectúa el análisis y la proyección de las series de tiempo. Una serie de 

tiempo es un grupo de datos registrados durante un periodo semanal, trimestral o anual. Dos 

ejemplos de las series de tiempo son las ventas 
de Microsoft Corporation por trimestre desde 
1985, y la producción anual de ácido sulfúrico 
desde 1970. 

Un análisis de la historia, que es una serie de 
tiempo, es útil para que la administración tome 
decisiones hoy y planee con base en una predic- 
ción, o proyección, de largo plazo. En general, se 
supone que los patrones pasados continuarán en 
el futuro. Las proyecciones de largo plazo se 
amplían a más de 1 año; son comunes las proyec- 
ciones de 2, 5 y 10 años. Las proyecciones de largo plazo son esenciales a fin de dar tiempo 
suficiente para que los departamentos de compras, manufactura, ventas, finanzas y otros de 
una compañía elaboren planes para construir nuevas plantas, solicitar financiamiento, desarro- 
llar productos nuevos y métodos de ensamble innovadores. 

En Estados Unidos, la proyección del nivel de ventas, tanto de corto como de largo pla- 
zos, se rige casi por la propia naturaleza de las organizaciones de negocios. La competencia 
por el dinero de los consumidores, la presión para obtener utilidades para los accionistas, el 
deseo de obtener una mayor participación de mercado y las ambiciones de los ejecutivos son 
algunas fuerzas de motivación en los negocios. Por lo tanto, se necesita una proyección (una 
declaración de los objetivos de la administración) para tener las materias primas, las instala- 
ciones de producción y el personal para cumplir con la demanda. 

Este capítulo trata del uso de los datos para proyectar eventos futuros. Primero se anali- 
zan los componentes de una serie de tiempo; luego, algunas técnicas para analizar los datos 
y, por último, se proyectan eventos futuros. 



16.2 Componentes de una serie de tiempo 

OA1 Definir los compo- Una serie de tiempo consta de cuatro componentes: tendencia, variación cíclica, variación 

nentes de una serie de estacional y variación irregular. 

tiempo. 


Tendencia secular 

Las tendencias de largo plazo de las ventas, el empleo, los precios accionarios y de otras 
series de negocios y económicas siguen varios patrones. Algunas se mueven hacia arriba en 
forma uniforme, otras declinan y otras más permanecen iguales con el paso del tiempo. 


c 


TENDENCIA SECULAR Dirección uniforme de una serie de tiempo de largo plazo. 


J 


Los siguientes son varios ejemplos de una tendencia secular. 

• Home Depot se fundó en 1978, y es el minorista más grande de Estados Unidos en artí- 
culos para mejorar el hogar. En la siguiente gráfica se muestra el número de empleados 
en Home Depot, Inc. Puede observar que este número aumentó con rapidez en los últi- 
mos 15 años. En 1993 había poco más de 50 000 empleados, mientras que en 2006 el 
número aumentó a más de 364 000. Desde entonces, el número de asociados ha dismi- 
nuido a 317 000 en 2010. 



606 


CAPÍTULO 16 Series de tiempo y proyección 





A 

• 

1 

«Mf 

íiwoíhiocci; 

2 

299) 

5C 0 

1 

1 *** 

« 7 .» 

4 

1*18 

«01 

5 

i*N 

(6.1 

• 

!W 

Uu 

7 

mt 

136.7 

1 

mi 

Mi 

1 

roce 

¿27.1 

10 

2001 

234.) 

11 

1002 

290.9 

12 

JOC) 

2*6.6 

u 

» 0* 

1261 

14 

2003 

KM 

13 

2006 

366.0 

14 

200? 

131- 0 

17 

20Ct 

131.0 

10 

2009 

122.0 

19 

2010 

117.0 


C O E F G 


Number of Associates at Home 
Depot, Inc. (1993 to 2010) 

«oa i 



H ■ • ■ 

9 

un UM 1501 2006 



<>• 


• El número de casas prefabricadas enviadas en Estados Unidos presentó un aumento uni- 
forme de 1990 a 1996, luego permaneció casi igual hasta 1999, cuando el número empe- 
zó a declinar. En 2002, el número era menor al de 1990 y continuó declinando hasta 2009. 
Esta información se muestra en la siguiente gráfica. 
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Variación cíclica 

El segundo componente de una serle de tiempo es la variación cíclica. Un ciclo de negocios 
habitual consiste en un periodo de prosperidad, seguido por periodos de recesión, depresión 
y luego recuperación. Hay fluctuaciones considerables que se desarrollan durante más de un 
año, arriba y debajo de la tendencia secular. Por ejemplo, en una recesión, el empleo, la pro- 
ducción, el Promedio Industrial Dow Jones y muchas otras serles tanto en los negocios como 
económicas se encuentran debajo de las líneas de las tendencias de largo plazo. Por el con- 
trario, en periodos de prosperidad se encuentran arriba de ellas. 
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VARIACIÓN CÍCLICA Aumento y reducción de una serie de tiempo durante periodos mayores 
de un año. 


> 


y 


En la tabla 16-1 se presentan las unidades anuales de baterías que vendió National 
Battery Retailers, Inc., desde 1991 hasta 2010. Se resalta el ciclo natural del negocio. Los 
periodos son de recuperación, seguidos por prosperidad, luego recesión y, por último, el ciclo 
desciende con depresión. 



Estadística en acción 

Los profesionales en esta- 
dística, economistas y eje- 
cutivos de negocios 
constantemente tratan de 
encontrar variables que 
les permitan proyectar la 
economía del país. La 
producción de petróleo 
crudo, el precio del oro 
en los mercados mundia- 
les y el Promedio Dow 
Jones, así como muchos 
índices que publica el 
gobierno, son variables 
que han tenido cierto 
éxito. También se han 
probado variables como 
la longitud de los trajes y 
el ganador del Súper 
Tazón. La variable que 
en general parece más 
exitosa es el precio del 
metal de desecho. ¿Por 
qué? El metal de desecho 
es el inicio de la cadena 
de manufactura. Cuando 
aumenta su demanda, es 
un indicador de que la 
manufactura también lo 
hará. 




Año 

GRÁFICA 16-1 Baterías que vendió National Battery Retailers, Inc., de 1991 a 2010 

Variación estacional 

El tercer componente de una serie de tiempo es la variación estacional. Muchas series 
de ventas, de producción y de otro tipo fluctúan de acuerdo con las temporadas. La unidad de 
tiempo se reporta por trimestre o por mes. 


VARIACIÓN ESTACIONAL Patrones de cambio en una serie de tiempo en un año. Estos patrones 
tienden a repetirse cada año. 


Casi todos los negocios suelen tener patrones estacionales recurrentes. Por ejemplo, la 
ropa para caballeros y niños tiene ventas muy elevadas justo antes de Navidad, y relativamen- 
te bajas después de esa celebración y durante el verano. Las ventas de juguetes son otro 
ejemplo con un patrón estacional extremo. Más de la mitad de los negocios del año se reali- 
zan, en general, en noviembre y diciembre. El negocio de jardinería es estacional en los esta- 
dos del noreste y del centro-norte de Estados Unidos. Muchos negocios tratan de equilibrar 
los efectos estacionales y se dedican a otras actividades de compensación estacional. En el 
noreste de Estados Unidos es posible ver al encargado de un negocio de jardinería con un qui- 
tanieve al frente del camión, en un intento por obtener algún ingreso durante la temporada de 
invierno. Con frecuencia, en las cercanías de los centros de esquí de todo el país hay campos 
de golf. Los propietarios de los albergues tratan de rentarlos a esquiadores en el invierno y a 
golfistas en el verano. Éste es un método eficaz para repartir los gastos fijos en todo el año, 
en lugar de distribuirlos sólo en algunos meses. 

En la gráfica 16-2 aparecen las ventas trimestrales, en millones de dólares, de Hercher 
Sporting Goods, Inc. Dicha compañía de artículos deportivos del área de Chicago se especia- 
liza en la venta de equipo de béisbol y softbol a preparatorias, universidades y ligas juveniles. 
También tiene varias tiendas de descuento en algunos de los centros comerciales más gran- 
des. Para su negocio existe un patrón estacional distintivo. La mayoría de sus ventas son en el 
primero y segundo trimestres del año, cuando las escuelas y organizaciones compran equipo 
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El método del promedio móvil 
uniformiza las fluctuaciones. 


OA2 Calcular un promedio 
móvil. 


Calcule la media de los pri- 
meros siete años. 



2008 


2009 


2010 


GRÁFICA 16-2 Ventas de equipo de béisbol y softbol, Hercher Sporting Goods, 2008-2010, 
por trimestre 


para la próxima temporada. Durante el verano se mantiene ocupada con la venta de equipo de 
reemplazo. Hace algunos negocios durante la temporada navideña (cuarto trimestre), mientras 
que las últimas semanas del verano (tercer trimestre) conforman su temporada baja. 

Variación irregular 

Muchos analistas prefieren subdividir la variación irregular en variaciones episódicas y resi- 
duales. Las fluctuaciones episódicas son impredecibles, pero es posible Identificarlas: por 
ejemplo, el efecto inicial de una huelga importante o de una guerra en la economía no se pue- 
den predecir. Después de eliminar las fluctuaciones episódicas, la variación restante se deno- 
mina variación residual. Las fluctuaciones residuales, con frecuencia denominadas 
fluctuaciones azarosas, son impredecibles y no se pueden identificar. Por supuesto, no es 
posible proyectar a futuro ni la variación episódica ni la residual. 

16.3 Promedio móvil 

Un promedio móvil es útil para suavizar una serie de tiempo y apreciar su tendencia. Además, 
es el método básico para medir la fluctuación estacional, que se describe más adelante en el 
capítulo. En contraste con el método de mínimos cuadrados, que expresa la tendencia en tér- 
minos de una ecuación matemática (Y = a + bt), el método del promedio móvil sólo suaviza 
las fluctuaciones de los datos. Este objetivo se logra al “desplazar” los valores medios aritmé- 
ticos en la serie de tiempo. 

Para aplicar el promedio móvil a una serie de tiempo, los datos deben seguir una tenden- 
cia muy lineal y tener un patrón rítmico definido de las fluctuaciones (que se repita, por ejem- 
plo, cada tres años). Los datos del siguiente ejemplo tienen tres componentes: tendencia, ciclo 
e Irregularidad, abreviadas 7, C e /. No hay variación estacional debido a que los datos se 
registran cada año. Lo que logra el promedio móvil es promediar C e /. Lo que queda es la ten- 
dencia. 

Si la duración de los ciclos es constante y las amplitudes de los ciclos son ¡guales, las 
fluctuaciones cíclica e irregular se eliminan por completo con el promedio móvil. El resultado 
es una recta. Por ejemplo, en la siguiente serie de tiempo, el ciclo se repite cada siete años y 
la amplitud de cada ciclo es 4; es decir, hay exactamente cuatro unidades desde el valle (el 
periodo más bajo) hasta el pico. Por lo tanto, el promedio móvil de siete años promedia a la 
perfección las fluctuaciones cíclicas e irregulares, y el residuo es una tendencia lineal. 

El primer paso para calcular el promedio móvil de siete años es determinar los totales 
móviles de siete años. Las ventas totales de los primeros siete años (1984-1990 inclusive) son 
$22 millones, determinadas por 1 + 2 + 3 + 4 + 5 + 4 + 3. (Consulte la tabla 16-1.) El total 
de $22 millones se divide entre 7 para determinar la media aritmética de las ventas anuales. El 
total de la suma de siete años (22) y la media de siete años (3.143) se colocan opuestos al año 
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TABLA 16-1 Cálculos para determinar el promedio móvil de siete años 


Año 

Ventas 
(en millones 
de dólares) 

Total móvil 
de siete 
años 

Promedio 
móvil de 
siete años 

1984 

$1 



1985 

2 



1986 

3 



1987 

4 

22 

3.143 

1988 

5 

23 

3.286 

1989 

4 

24 

3.429 

1990 

3 

25 

3.571 

1991 

2 

26 

3.714 

1992 

3 

27 

3.857 

1993 

4 

28 

4.000 

1994 

5 

29 

4.143 

1995 

6 

30 

4.286 

1996 

5 

31 

4.429 

1997 

4 

32 

4.571 

1998 

3 

33 

4.714 

1999 

4 

34 

4.857 

2000 

5 

35 

5.000 

2001 

6 

36 

5.143 

2002 

7 

37 

5.286 

2003 

6 

38 

5.429 

2004 

5 

39 

5.571 

2005 

4 

40 

5.714 

2006 

5 

41 

5.857 

2007 

6 



2008 

7 



2009 

8 




medio de ese grupo de siete, es decir, 1987, como indica la tabla 16-1. Luego se determinan 
las ventas totales de los siguientes siete años (1985-1991 inclusive). (Una forma conveniente 
para hacer este cálculo es restar las ventas de 1984 [$1 millón] al primer total de siete años 
[$22 millones] y sumar las ventas de 1991 [$2 millones], para obtener el nuevo total de $23 
millones.) La media de este total, $3.286 millones, se coloca opuesta al año medio, 1988. Los 
datos de las ventas y el promedio móvil de siete años aparecen en la gráfica 1 6-3. 



GRÁFICA 16-3 Ventas y promedio móvil de siete años 
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Determinación de un prome- 
dio móvil de un periodo con 
número par, como cuatro 
años. 


El número de valores de datos que se incluirán en un promedio móvil depende del carác- 
ter de los datos recopilados. Si son trimestrales, puesto que hay cuatro trimestres en un año, 
sería adecuado tener cuatro términos. Si los datos son diarios, como hay siete días en una 
semana, sería apropiado tener siete términos. También se puede emplear el método de prue- 
ba y error para determinar un número que nivele mejor las fluctuaciones debidas al azar. 

Un promedio móvil se calcula muy fácil con Excel, pues sólo requiere un comando. Si los 
datos originales se encuentran en las ubicaciones D3 a D20 y se quiere obtener un promedio 
móvil con tres periodos, se puede ir a la posición E4 y escribir = (D3 + D4 + D5)/3 , y luego 
copiar la misma fórmula en la posición El 9. 

En la tabla 16-2 se muestran los promedios móviles de tres y cinco años de algunos datos 
de producción, y se ilustran en la gráfica 16-4. 


TABLA 16-2 Promedio móvil de tres y cinco años 


Año 

Producción, 

Y 

Total móvil 
de tres 
años 

Promedio 
móvil de 
cinco años 

Total móvil 
de cinco 
años 

Promedio 
móvil de 
cinco años 

1991 

5 





1992 

6 

19 

6.3 



1993 

8 

24 

8.0 

34 

6.8 

1994 

10 

23 

7.7 

32 

6.4 

1995 

5 

18 

6.0 

33 

6.6 

1996 

3 

15 

5.0 

35 

7.0 

1997 

7 

20 

6.7 

37 

7.4 

1998 

10 

29 

9.7 

43 

8.6 

1999 

12 

33 

11.0 

49 

9.8 

2000 

11 

32 

10.7 

55 

11.0 

2001 

9 

33 

11.0 

60 

12.0 

2002 

13 

37 

12.3 

66 

13.2 

2003 

15 

46 

15.3 

70 

14.0 

2004 

18 

48 

16.0 

72 

14.4 

2005 

15 

44 

14.7 

73 

14.6 

2006 

11 

40 

13.3 

75 

15.0 

2007 

14 

42 

14.0 

79 

15.8 

2008 

17 

53 

17.7 



2009 

22 






Las ventas, la producción y otras series económicas y de negocios en general no tienen 
1) periodos de oscilación con igual longitud ni 2) oscilaciones con amplitudes iguales. Por lo 
tanto, en la práctica, la aplicación de un promedio móvil no genera de manera precisa una 
recta. Por ejemplo, la serie de producción de la tabla 16-2 se repite casi cada cinco años, pero 
la amplitud de los datos varía de una oscilación a otra. La tendencia parece ser ascendente y 
un tanto lineal. Los dos promedios móviles, el de tres años y el de cinco, parecen adecuados 
para describir la tendencia en la producción desde 1991. 

El promedio móvil de cuatro años, seis años y otros números de años pares presentan un 
problema menor respecto del centrado de los totales móviles y de los promedios móviles. 
Observe en la tabla 1 6-3 que no hay un periodo central, por lo que los totales móviles se colo- 
can entre dos periodos. El total de los primeros cuatro años ($42) se coloca entre 2002 y 2003. 
El total de los siguientes cuatro años es $43. Se obtiene la media de los promedios de los pri- 
meros cuatro años y de los segundos cuatro años ($1 0.50 y $1 0.75, respectivamente), y la cifra 
resultante se centra en 2003. Este procedimiento se repite hasta calcular todos los promedios 
posibles de cuatro años. 
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GRÁFICA 16-4 Promedio móvil de tres y cinco años de 1991 a 2009 


TABLA 16-3 Promedio móvil de cuatro años 






Promedio 



Total móvil 

Promedio 

móvil de 


Ventas, 

de cuatro 

móvil de 

cuatro años 

Año 

Y 

años 

cuatro años 

centrado 

2001 

$ 8 




2002 

11 

$42 (8 + 11 + 9 + 14) 

$10.50 ($42 * 4) 


2003 

9 

43 (11 + 9 + 14 + 9) 

10.75 ($43 * 4) 

10.625 

2004 

14 

42 

10.50 

10.625 

2005 

9 

43 

10.75 

10.625 

2006 

10 

37 

9.25 

10.000 

2007 

10 

40 

10.00 

9.625 

2008 

8 




2009 

12 





16.4 Promedio móvil ponderado 

En un promedio móvil se utiliza la misma ponderación para cada observación. Por ejemplo, el 
total móvil de tres años se divide entre el valor 3 para producir el promedio móvil. En otras 
palabras, en este caso, cada valor de datos tiene una ponderación de un tercio. De manera 
similar, en el caso de un promedio móvil de cinco años, cada valor de datos tiene una ponde- 
ración de un quinto. 
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Una extensión natural de la media ponderada que se analizó en el capítulo 3 es para cal- 
cular un promedio móvil ponderado. Esto Implica seleccionar una posible ponderación distin- 
ta para cada valor de datos y luego calcular un promedio ponderado de los valores n más 
recientes como valor uniformizado. En la mayoría de las aplicaciones se emplea el valor uni- 
formizado como una proyección al futuro. Por lo tanto, a la observación más reciente se le da 
la ponderación mayor, la cual disminuye con valores de datos más antiguos. Observe que, 
tanto en el promedio móvil simple como en el promedio móvil ponderado, la suma de las pon- 
deraciones es igual a 1. 

Por ejemplo, suponga que calcula un promedio móvil ponderado de dos años para los 
datos de la tabla 16-3, y se obtiene una ponderación del doble al valor más reciente. En otras 
palabras, se asigna una ponderación de 2/3 al último año y de 1/3 al valor inmediatamente 
anterior a ése. Luego, las ventas “proyectadas” para 2003 se determinan mediante (1/3)($8) + 
(2/3)($11) = $10. El siguiente promedio móvil se calcularía como (1/3)($11) + (2/3)($9) = 
$9.667. De la misma manera, el promedio móvil final, o ponderado, de 2010, sería (1/3)($8) + 
(2/3)($12) = $10.667. En resumen, la técnica de utilizar promedios móviles tiene el objetivo de 
identificar la tendencia de largo plazo en una serie de tiempo (pues suaviza las fluctuaciones 
de corto plazo). Se utiliza para revelar cualesquiera fluctuaciones cíclicas y estacionales. 


Cjemplo 


Cedar Fair opera siete parques de diversiones y cinco parques acuáticos i 
asistencia combinada (en miles) durante los últimos 17 años aparece en la 
socio le pide estudiar la tendencia de la asistencia. Calcule un pro- 
medio móvil de tres años y un promedio móvil ponderado de tres 
años con ponderaciones de 0.2, 0.3 y 0.5 para años sucesivos. 


ndependientes. Su 
siguiente tabla. Un 



Año 

Asistencia 

(miles) 

1993 

5 761 

1994 

6 148 

1995 

6 783 

1996 

7 445 

1997 

7 405 

1998 

11 450 

1999 

11 224 

2000 

11 703 

2001 

11 890 

2002 

12 380 

2003 

12 181 

2004 

12 557 

2005 

12 700 

2006 

19 300 

2007 

22 100 

2008 

22 720 

2009 

21 136 


Solución 


El promedio móvil de tres años es: 


Año 

Asistencia 

(miles) 

Promedio 

móvil 

Determinado por 

1993 

5 761 



1994 

6 148 

6 231 

(5 761 + 6 148 + 6 783)/3 

1995 

6 783 

6 792 

(6 148 + 6 783 + 7 445)/3 

1996 

7 445 

7 211 

(6 783 + 7 445 + 7 405)/3 

1997 

7 405 

8 767 

(7 445 + 7 405 + 11 450)/3 

1998 

11 450 

10 026 

(7 405 + 11 450 + 11 224)/3 

1999 

11 224 

11 459 

(11 450 + 11 224 + 11 703)/3 

2000 

11 703 

11 606 

(11 224 + 11 703 + 11 890)/3 




(i continúa ) 





16.4 Promedio móvil ponderado 


Año 

Asistencia 

(miles) 

Promedio 

móvil 

Determinado por 

2001 

11 890 

11 991 

(11 703 + 

11 890 

+ 

12 380)/3 

2002 

12 380 

12 150 

(11 890 + 

12 380 

+ 

12 1 81 )/3 

2003 

12 181 

12 373 

(12 380 + 

12 181 

+ 

12 557)/3 

2004 

12 557 

12 479 

(12 181 + 

12 557 

+ 

12 700)/3 

2005 

12 700 

14 852 

(12 557 + 

12 700 

+ 

19 300)/3 

2006 

19 300 

18 033 

(12 700 + 

19 300 

+ 

22 1 00)/3 

2007 

22 100 

21 373 

(19 300 + 

22 100 

+ 

22 720)/3 

2008 

22 720 

21 985 

(22 100 + 

22 720 

+ 

21 1 36)/3 

2009 

21 136 







El promedio móvil ponderado de tres años es: 



Asistencia 

Promedio 


Año 

(miles) 

móvil ponderado 

Determinado por 

1993 

5 761 



1994 

6 148 

6 388 

. 2(5 761 )+ . 3(6 148 )+ . 5(6 783 ) 

1995 

6 783 

6 987 

. 2(6 148 )+ . 3(6 783 )+ . 5(7 445 ) 

1996 

7 445 

7 293 

. 2(6 783 ) + . 3(7 445 ) + . 5(7 405 ) 

1997 

7 405 

9 436 

. 2(7 445 )+ . 3(7 405 ) + . 5(11 450 ) 

1998 

11 450 

10 528 

. 2(7 405 ) + . 3(11 450 ) + . 5(11 224 ) 

1999 

11 224 

11 509 

. 2(11 450 ) + . 3(11 224 ) + . 5(11 703 ) 

2000 

11 703 

11 701 

. 2(11 224 ) + . 3(11 703 ) + . 5(11 890 ) 

2001 

11 890 

12 098 

. 2(11 703 ) + . 3(11 890 ) + . 5(12 380 ) 

2002 

12 380 

12 183 

. 2(11 890 ) + . 3(12 380 ) + . 5(12 181 ) 

2003 

12 181 

12 409 

. 2(12 380 ) + . 3(12 181 ) + . 5(12 557 ) 

2004 

12 557 

12 553 

. 2(12 181 ) + . 3(12 557 ) + . 5(12 700 ) 

2005 

12 700 

15 971 

. 2(12 557 ) + . 3(12 700 ) + . 5(19 300 ) 

2006 

19 300 

19 380 

. 2(12 700 ) + . 3(19 300 ) + . 5(22 100 ) 

2007 

22 100 

21 850 

. 2(19 300 ) + . 3(22 100 ) + . 5(22 720 ) 

2008 

22 720 

21 804 

. 2(22 100 ) + . 3(22 720 ) + . 5(21 136 ) 

2009 

21 136 
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Estudie la gráfica con cuidado. Observará que la tendencia de la asistencia es ascendente de 
manera uniforme, con 360 000 visitantes más cada año. Sin embargo, hay un “salto” de casi 3 
millones por año entre 1997 y 1998. Es probable que esto refleje que Cedar Fair adquirió 
Knott’s Berry Farm a finales de 1997, lo que generó un incremento repentino de la asistencia. 
Ocurrió un auge similar en 2006 con la compra de King’s Island, cerca de Cincinnati. El prome- 
dio móvil ponderado sigue los datos de manera más cercana que el promedio móvil, lo que 
refleja la influencia adicional que recibe el periodo más reciente. En otras palabras, el método 
ponderado, conforme al cual se da la ponderación mayor al periodo más reciente, no será tan 
uniforme. Sin embargo, quizá sea más preciso como herramienta de proyección. 



Determine el promedio móvil de tres años de las ventas de Waccamaw Machine Tool, Inc. Trace los 
datos originales y el promedio móvil. 


Año 

Número 

producido (miles) 

Año 

Número 

producido (miles) 

2005 

2 

2008 

5 

2006 

6 

2009 

3 

2007 

4 

2010 

10 


comed 


Ejercicios 

1. Calcule un promedio móvil ponderado en cuatro trimestres del número de suscriptores de la 
Boxley Box Company durante los nueve trimestres que abarcan los datos. Éstos se reportan en 
miles. Aplique ponderaciones de 0.1, 0.2, 0.3 y 0.4, respectivamente, a los trimestres. En pocas 
palabras, describa la tendencia en el número de suscriptores. ^ 


1er. trimestre 2008 

28 766 

2o. trimestre 2008 

30 057 

3r. trimestre 2008 

31 336 

4o. trimestre 2008 

33 240 

1er. trimestre 2009 

34 610 

2o. trimestre 2009 

35 102 

3r. trimestre 2009 

35 308 

4o. trimestre 2009 

35 203 

1er. trimestre 2010 

34 386 


2. En la siguiente tabla aparece el número de boletos para cine que vendió el Library Cinema- 
Complex, en miles, durante el periodo de 1998 a 2010. Calcule el promedio móvil ponderado de 
cinco años con ponderaciones de 0.1, 0.1, 0.2, 0.3 y 0.3, respectivamente. Describa la tendencia 
del rendimiento. m 


1998 

8.61 

2005 

6.61 

1999 

8.14 

2006 

5.58 

2000 

7.67 

2007 

5.87 

2001 

6.59 

2008 

5.94 

2002 

7.37 

2009 

5.49 

2003 

6.88 

2010 

5.43 

2004 

6.71 
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0A3 Determinar una ecua- 
ción de tendencia lineal. 


La pendiente de la recta de la 
tendencia es b. 


16.5 Tendencia lineal 

La tendencia de largo plazo de muchas series de negocios, como ventas, exportaciones y pro- 
ducción, con frecuencia se aproxima a una recta. En este caso, la ecuación para describir este 
crecimiento es: 


ECUACIÓN DE TENDENCIA LINEAL 




Y = a + bt 


(16-1) 




donde: 

Y que se lee Y testada, es el valor proyectado de la variable Y de un valor seleccionado 
de t. 

a es la intersección con el eje Y. Es el valor estimado de Y cuando t = 0. Otra forma de 
expresar esto es: a es el valor estimado de Y donde la línea cruza el eje Y cuando t es 
cero. 

b es la pendiente de la recta, o el cambio promedio en Y por cada aumento de una uni- 
dad en t. 

t es cualquier valor de tiempo seleccionado. 

Para ilustrar el significado de Y, a, b y t en un problema de serie de tiempo, en la gráfica 
1 6-5 se traza una recta para representar la tendencia habitual de las ventas. Suponga que esta 
compañía inició sus operaciones en 2001. Este año inicial (2001) se designa de manera arbi- 
traria como año 1 . Observe que las ventas aumentaron $2 millones en promedio cada año; es 
decir, con base en la recta trazada por los datos de ventas, éstas aumentaron de $3 millones 
en 2001 a $5 millones en 2002, a $7 millones en 2003, a $9 millones en 2004, y así sucesiva- 
mente. Por lo tanto, la pendiente, o b, es 2. Además, observe que la recta interseca el eje Y 
(cuando t = 0) en $1 millón. Este punto es a. Otra manera de determinar b es ubicar el punto 
de partida de la recta en el año 1 , que en este problema es 3 para 2001 . Luego se ubica el 
valor en la recta del último año, que para 2009 es 19. Las ventas se incrementaron $19 millo- 
nes - $3 millones = $16 millones, en ocho años (de 2001 a 2009). Por lo tanto, 16 -e 8 = 2, 
que es la pendiente de la recta, o b. 



123456789 Códigos 


GRAFICA 16-5 Recta ajustada a los datos de ventas 


La ecuación de la recta de la gráfica 1 6-5 es: 

Y = 1 + 2f 


donde: 

Y representa las ventas en millones de dólares. 

1 es la intercepción con el eje Y. También representa las ventas en millones de dólares del 
año 0, o 2000. 

t se refiere al incremento de ventas anual. 
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OA4 Utilizar la ecuación de 
la tendencia para calcular 
proyecciones. 


Cjemplo 


Solución 


En el capítulo 13 se trazó una recta por los puntos en un diagrama de dispersión para 
aproximar la recta de regresión. Sin embargo, cabe observar que este método para determi- 
nar la ecuación de regresión tiene una desventaja importante: la posición de la recta depende 
del criterio del individuo que la trace. Es probable que tres personas tracen tres rectas dis- 
tintas de las gráficas de dispersión. De igual forma, la recta que se traza según los datos 
de ventas en la gráfica 16-5 quizá no sea la recta de mejor ajuste. Debido al criterio subjetivo, 
este método sólo se debe emplear cuando se necesite una aproximación rápida de la ecua- 
ción de la recta, o para verificar si la recta de mínimos cuadrados es razonable, tema que se 
analiza en seguida. 

16.6 Método de los mínimos cuadrados 

En el análisis de una regresión lineal simple, en el capítulo 13, se mostró el método de los míni- 
mos cuadrados para determinar la mejor relación lineal entre dos variables. En los métodos de 
proyección, el tiempo es la variable independiente, y el valor de la serie de tiempo, la depen- 
diente. Además, con frecuencia se codifica la variable independiente (tiempo), para facilitar la 
interpretación de las ecuaciones. En otras palabras, se hace que t sea 1 en el primer año, 2 en 
el segundo, y así en lo sucesivo. Si una serie de tiempo incluye las ventas de General Electric 
para cinco años iniciando en 2002 hasta 2006, se codifica el año 2002 como 1 , 2003 como 2, 
y 2006 como 5. 


Las ventas de Jensen Foods, una pequeña cadena de abarrotes ubicada en el suroeste de 
Texas, desde 2005 son: 


Año 

Ventas (en 
millones de dólares) 

2005 

7 

2006 

10 

2007 

9 

2008 

11 

2009 

13 


Determine la ecuación de regresión. ¿Cuál es el incremento anual de las ventas? ¿Cuál es la 
proyección de las ventas para 2012? 

Para determinar la ecuación de la tendencia puede utilizar la fórmula (13-4) para encontrar 
la pendiente, o valor de b, y la fórmula (13-5) para ubicar la intercepción, o valor de a. Se sus- 
tituye f, los valores codificados del año, por X en estas ecuaciones. Otra aproximación es em- 
plear un paquete de software, como Minitab o Excel. En la gráfica 16-6 aparece la captura de 



GRÁFICA 16-6 Ventas y recta de la tendencia, 2005-2009 




16.6 Método de los mínimos cuadrados 


617 


Estadística en acción 

Con frecuencia los inver- 
sionistas emplean el aná- 
lisis de regresión para 
estudiar la relación entre 
una acción en particular 
y la condición general del 
mercado. La variable 
dependiente es el cambio 
porcentual mensual del 
valor de la acción, y la 
variable independiente es 
el cambio porcentual 
mensual de un índice de 
mercado, como el índice 
Compuesto 500 de 
Standard & Poor’s. El 



pantalla de Minitab. Los valores del año, años codificados y ventas ajustadas aparecen en la 
parte inferior derecha de la captura de pantalla. La mitad izquierda es una gráfica de disper- 
sión de los datos y la recta de regresión ajustada. 

A partir de la salida la ecuación de la tendencia es / = 6.1 + 1.3f. ¿Cómo se interpreta 
esta ecuación? Las ventas están en millones de dólares. Por lo tanto, el valor 1 .3 indica que 
las ventas aumentaron a una tasa de 1.3 millones de dólares por año. El valor 6.1 es el valor 
estimado de las ventas en el año 0; es decir, la estimación de 2004, el cual se denomina año 
base. Por ejemplo, para determinar el punto en la recta de 2008, se sustituye el valor de t de 
4 en la ecuación. Entonces / = 6.1 + 1.3(4) = 11.3. 

Si las ventas, la producción u otros datos se aproximan a una tendencia lineal, se emplea 
la ecuación desarrollada mediante la técnica de mínimos cuadrados para estimar valores futu- 
ros. Es razonable que las ventas de Jensen Foods sigan una tendencia lineal. Por ello se utili- 
za la ecuación de la tendencia para proyectar las ventas futuras. 

Consulte la tabla 1 6-4. El año 2005 se codifica como 1 , el año 2007 como 3, y el año 2009 
como 5. Es lógico codificar 201 1 como 7 y 201 2 como 8. Por lo tanto, se sustituye 8 en la ecua- 
ción de la tendencia y se despeja Y. 

Y = 6.1 + 1 ,3f = 6.1 +1 .3(8) = 1 6.5 

De esta manera, con base en las ventas pasadas, la estimación para 2012 es $16.5 millones. 


TABLA 16-4 Cálculos para determinar los puntos de la recta de mínimos cuadrados con los valores 
codificados 


valor de b en la ecuación 
de regresión es el coefi- 
ciente beta , o sólo beta, 
de la acción en particu- 
lar. Si b es mayor que 1, 
se deduce que la acción 
es sensible a los cambios 
que se producen en el 
mercado. Si b se encuen- 
tra entre 0 y 1 , la implica- 
ción es que la acción no 
es sensible a los cambios 


Año 

Ventas (en 
millones de 
dólares), Y 

t 

Y 

Determinado 

por 

2005 

7 

1 

7.4 

6.1 + 1.3(1) 

2006 

10 

2 

8.7 

6.1 + 1.3(2) 

2007 

9 

3 

10 

6.1 + 1.3(3) 

2008 

11 

4 

11.3 

6.1 + 1.3(4) 

2009 

13 

5 

12.6 

6.1 + 1.3(5) 


del mercado. 


En este ejemplo de serie de tiempo, había cinco años de datos de ventas. Con base en 
estas cinco cifras de ventas, se estiman las ventas de 2012. Muchos investigadores sugieren 
que no se proyecten ventas, producción u otras series de negocios y económicas más que n/2 
periodos de tiempo a futuro, donde n es el número de puntos de datos. Por ejemplo, si hay 10 
años de datos, sólo se estiman hasta 5 años a futuro (n/2 = 10/2 = 5). Otros sugieren que la 
proyección no puede ser mayor que 2 años, en especial en tiempos de cambios económicos 
rápidos. 



Autoevaluación 16-2 


La siguiente es la producción anual de sillas mecedoras grandes de Wood Products, Inc., desde 
2002 . 


Año 

Producción 

(miles) 

Año 

Producción 

(miles) 

2002 

4 

2006 

11 

2003 

8 

2007 

9 

2004 

5 

2008 

11 

2005 

8 

2009 

14 


a) Trace los datos de la producción en un diagrama de dispersión. 

b ) Determine la ecuación de mínimos cuadrados con un paquete de software. 

c) Determine los puntos de la recta de 2002 y 2009. Conecte los puntos para llegar a la recta. 

d) Con base en la ecuación de la tendencia lineal, ¿cuál es la producción estimada de 2012? 
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comed 


OA5 Calcular una ecuación 
de tendencia no lineal. 


Ejercicios 

3. A continuación se reporta el número de habitaciones alquiladas en Plantation Resorts, Georgia, de 
los años de 1999 a 2009. 


Año 

Alquiladas 

Año 

Alquiladas 

Año 

Alquiladas 

1999 

6 714 

2003 

9 762 

2007 

6 162 

2000 

7 991 

2004 

10 180 

2008 

6 897 

2001 

9 075 

2005 

8 334 

2009 

8 285 

2002 

9 775 

2006 

8 272 




Determine la ecuación de mínimos cuadrados. De acuerdo con esta información, ¿cuáles son los 
alquileres estimados para 2010? 

4 . En la siguiente tabla aparecen las ventas netas en millones de dólares de Home Depot, Inc., y sus 
subsidiarias de 1993 a 2009. 


Año 

Ventas netas 

Año 

Ventas netas 

Año 

Ventas netas 

1993 

$ 9 239 

1999 

$38 434 

2005 

$81 511 

1994 

12 477 

2000 

45 738 

2006 

90 837 

1995 

15 470 

2001 

53 553 

2007 

77 349 

1996 

19 535 

2002 

58 247 

2008 

71 300 

1997 

24 156 

2003 

64 816 

2009 

66 200 

1998 

30 219 

2004 

73 094 




Determine la ecuación de mínimos cuadrados. Con base en esta información, ¿cuáles son las ven- 
tas estimadas para 201 0 y 201 1 ? 

5. En la siguiente tabla aparecen las cantidades anuales de vidrio de desecho producido por Kimble 
Glass Works, Inc. 


Año 

Código 

Desecho 

(toneladas) 

Año 

Código 

Desecho 

(toneladas) 

2006 

1 

2 

2009 

4 

5 

2007 

2 

4 

2010 

5 

6 

2008 

3 

3 





Determine la ecuación de la tendencia de mínimos cuadrados. Estime la cantidad de desecho que 
se generará en 2012. 

6. En la siguiente tabla aparecen las ventas de Walder’s Milk and Dairy Products, en millones de dóla- 
res, durante el periodo de 2004 a 2010. m 


Año 

Código 

Ventas (en 
millones de dólares) 

Año 

Código 

Ventas (en 
millones de dólares) 

2004 

1 

17.5 

2008 

5 

24.5 

2005 

2 

19.0 

2009 

6 

26.7 

2006 

3 

21.0 

2010 

7 

27.3 

2007 

4 

22.7 





Determine la ecuación de la tendencia de mínimos cuadrados. Estime las ventas de 2012. 


16.7 Tendencias no lineales 

En el análisis anterior la atención se centró en una señe de tiempo cuyo crecimiento o decli- 
nación se aproximaban a una recta. Una ecuación de tendencia lineal se utiliza para represen- 
tar la serie de tiempo cuando se considera que los datos aumentan (o disminuyen) en 
cantidades iguales, en promedio, de un periodo a otro. 

Los datos que aumentan (o disminuyen) en cantidades cada vez mayores durante un pe- 
riodo aparecen curvilíneos cuando se trazan en una gráfica con escala aritmética. En otras pa- 


16.7 Tendencias no lineales 
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labras, los datos que aumentan (o disminuyen) en porcentajes o proporciones iguales durante 
un periodo aparecen curvilíneos sobre un papel cuadriculado. (Vea la gráfica 16-7.) 

La ecuación de la tendencia de una serie de tiempo que no se aproxime a una tendencia 
curvilínea, como la que se representa en la gráfica 16-7, se calcula con los logaritmos de los 
datos y el método de mínimos cuadrados. La ecuación general de la ecuación de la tenden- 
cia logarítmica es: 


ECUACIÓN DE TENDENCIA LOGARÍTMICA 


log Y = log a + log b(t) 


( 16 - 2 ) 


La ecuación de la tendencia logarítmica se puede determinar, con los datos de Gulf Sho- 
res Importers de la gráfica 16-7, utilizando Excel. El primer paso es capturar la información 
y después determinar el logaritmo base 10 de cada una de las Importaciones del año. Por últi- 
mo, se utiliza el procedimiento de regresión para encontrar la ecuación de mínimos cuadrados. 
En otras palabras, se toma el logaritmo de cada uno de los datos del año, y luego se utilizan 
los logaritmos como la variable dependiente y el año codificado como la Independiente. 



Años 


GRÁFICA 16-7 Ventas de Gulf Shores Importers, 1996-2010 
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La ecuación de regresión es f = 2.053805 + 0.153357f, que es la forma logarítmica. 
Ahora se tiene una ecuación de la tendencia en términos del porcentaje de cambio. Es decir, 
el valor 0.153357 es el porcentaje de cambio de Y por cada aumento unitario de t. Este valor 
es similar a la media geométrica descrita en la sección 3.10 del capítulo 3. 

El logaritmo de b es 0.153357, y su antilogaritmo, o inverso, 1 .423498. Si a este valor se 
le resta 1 , como se hizo en el capítulo 3, el valor 0.423498 indica la tasa anual de incremento 
de la media geométrica de 1996 a 2010. La conclusión es que las importaciones aumentaron 
a una tasa de 42.35% al año durante el periodo. 

También se utiliza la ecuación de la tendencia logarítmica para hacer estimaciones de 
valores futuros. Suponga que desea estimar las importaciones de 2014. El primer paso es 
determinar el código de 2009, que es 19. Para explicar esto, el año 2010 tiene un código de 
15 y el año 2014 es cuatro años más tarde; en consecuencia, 15 + 4 = 19. El logaritmo de las 
importaciones de 2014 es: 

Y= 2.053805 + 0.153357Í = 2.053805 + 0.153357(19) = 4.967588 

Para encontrar las importaciones estimadas de 2014, necesita el antilogaritmo de 4.967588, 
que es 92 809. Éste es la estimación del número de importaciones de 2014. Recuerde que los 
datos se dieron en miles de dólares, por lo que la estimación es $92 809 000. 


Autoevaluación 16-3 Las ventas de Tomlin Manufacturing desde 2006 son: 



Año 

Ventas (en millones 
de dólares) 

2006 

2.13 

2007 

18.10 

2008 

39.80 

2009 

81 .40 

2010 

112.00 


a) Determine la ecuación de la tendencia logarítmica de los datos de ventas. 

b) ¿Cuál fue el porcentaje de incremento anual de las ventas de 2006 a 2010? 

c) ¿Cuáles son las ventas proyectadas para 201 1 ? 


comect 


Ventas (en millones 
Año de dólares) 

2003 

1.1 

2004 

1.5 

2005 

2.0 

2006 

2.4 

2007 

3.1 


Ejercicios 

7. Sally’s Software, Inc., es proveedor de software de computadora en el área de Sarasota. La com- 
pañía tiene un crecimiento rápido. Las ventas de los últimos cinco años aparecen a la izquierda. 



a) Determine la ecuación de la tendencia logarítmica. 

b) En promedio, ¿en qué porcentaje aumentaron las ventas durante el periodo? 

c) Estime las ventas de 2010. 

8. Al parecer, las importaciones de carbón negro aumentaron casi 10% al año. 


Año 

Importaciones 
de carbón negro 
(miles de toneladas) 

Año 

Importaciones 
de carbón negro 
(miles de toneladas) 

2000 

92.0 

2004 

135.0 

2001 

101.0 

2005 

149.0 

2002 

112.0 

2006 

163.0 

2003 

124.0 

2007 

180.0 


a) Determine la ecuación de la tendencia logarítmica. 

b) En promedio, ¿en qué porcentaje aumentaron las importaciones durante el período? 

c) Estime las importaciones durante 2010. 
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16.8 Variación estacional 

Con anterioridad se mencionó que la variación estacional es otro componente de 
una serie de tiempo. Las series de negocios, como las ventas de automóviles, los 
embarques de botellas de bebidas de cola y la construcción residencial, tienen 
periodos de actividad superior e inferior al promedio cada año. En el área de pro- 
ducción, una razón para analizar las fluctuaciones estacionales es contar con un 
abastecimiento suficiente de materias primas que permita cumplir con la cambian- 
te demanda estacional. La división de recipientes de vidrio de una compañía impor- 
tante del sector, por ejemplo, fabrica botellas de cerveza no retornables, frascos 
para yodo, frascos para aspirina, botellas para cemento plastificado, etc. El depar- 
tamento de programación de producción necesita saber cuántas botellas debe pro- 
ducir y cuándo de cada tipo. Una corrida de demasiadas botellas de un tipo puede 
ocasionar un problema grave de almacenamiento. La producción no se puede basar 
por completo en los pedidos existentes, pues muchos pedidos se hacen por teléfo- 
no para su embarque inmediato. Como la demanda de muchas botellas varía de 
acuerdo con la temporada, una proyección con una anticipación de un año o dos, 
por mes, es esencial para lograr una programación adecuada. 

Un análisis de las fluctuaciones estacionales durante un periodo de años tam- 
bién puede ayudar para evaluar las ventas actuales. Las ventas habituales de tien- 
das departamentales en Estados Unidos, salvo las ventas por correo, aparecen 
como índices en la tabla 16-5. Cada índice representa las ventas promedio de un 
periodo de varios años. Las ventas reales de algunos meses estuvieron arriba del promedio 
(representado por un índice mayor que 1 00), y las ventas de los demás meses, debajo del pro- 
medio. El índice de 126.8 de diciembre indica que, por lo regular, las ventas de diciembre son 
26.8% superiores al mes promedio; el índice de 86.0 de julio indica que las ventas departa- 
mentales de este mes casi siempre son 14% menores a las de un mes promedio. 



TABLA 16-5 Indices estacionales habituales de ventas en tiendas departamentales en Estados Unidos, 
excluyendo las ventas por correo 


Enero 

87.0 

Julio 

86.0 

Febrero 

83.2 

Agosto 

99.7 

Marzo 

100.5 

Septiembre 

101.4 

Abril 

106.5 

Octubre 

105.8 

Mayo 

101.6 

Noviembre 

111.9 

Junio 

89.6 

Diciembre 

126.8 


Suponga que un gerente de tienda emprendedor, en un esfuerzo por estimular las ventas 
durante diciembre, introdujo diversas promociones únicas, como coros de villancicos por toda 
la tienda, exhibiciones mecánicas y dependientes vestidos con trajes de Santa Claus. Cuando 
se calculó el índice de ventas de ese mes, fue 150.0. En comparación con las ventas de 
diciembre habituales de 126.8, se concluyó que el programa de promoción fue un gran éxito. 

Determinación de un índice estacional 

OA6 Determinar e interpre- Un conjunto habitual de índices mensuales consta de 12 índices representativos de los datos 
tar un conjunto de índices de un periodo de 12 meses. Es lógico que haya cuatro índices estacionales habituales con los 

estacionales. datos reportados en el trimestre. Cada índice es un porcentaje, cuyo promedio anual es igual 

a 100.0; es decir, cada índice mensual indica el nivel de ventas, producción u otra variable en 
relación con el promedio anual de 100.0. Un índice habitual de 96.0 en enero indica que las 
ventas (o cualquier otra variable) están, en general, 4% debajo del promedio del año. Un índi- 
ce de 107.2 en octubre significa que la variable está, en general, 7.2% arriba de él. 

Hay varios métodos para medir las fluctuaciones estacionales habituales en una serie de 
tiempo. El método más común para calcular el patrón estacional habitual se denomina méto- 
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do de la razón con el promedio móvil. Este método elimina los componentes de tendencia, 
cíclicos e Irregulares de los datos originales (Y). En el siguiente análisis, T se refiere a la ten- 
dencia, S a la variación estacional, C a la variación cíclica e / a la variación irregular. Los núme- 
ros que resultan se conocen como índice estacional habitual. 

Se estudiarán con detalle los pasos para obtener los índices estacionales habituales con 
el método de la razón con el promedio móvil. Para ¡lustrar este método, se eligen las ventas 
trimestrales de Toys International. Primero, se muestran los pasos necesarios para llegar al 
conjunto de índices estacionales habituales. Luego se utiliza el software MegaStat Excel y 
Minitab para calcular los índices estacionales. 


Cjemplo 


Solución 


En la tabla 1 6-6 aparecen las ventas trimestrales de Toys International de 2004 a 2009. Las ven- 
tas se reportan en millones de dólares. Determine un índice estacional trimestral con el méto- 
do de la razón con el promedio móvil. 

IABLA 16-6 Ventas trimestrales de Toys International (millones de dólares) 


Año 

Invierno 

Primavera 

Verano 

Otoño 

2004 

6.7 

4.6 

10.0 

12.7 

2005 

6.5 

4.6 

9.8 

13.6 

2006 

6.9 

5.0 

10.4 

14.1 

2007 

7.0 

5.5 

10.8 

15.0 

2008 

7.1 

5.7 

11.1 

14.5 

2009 

8.0 

6.2 

11.4 

14.9 


En la gráfica 16-8 aparecen las ventas trimestrales de Toys International durante el periodo de 
seis años. Observe la naturaleza estacional de las ventas. En cada año, las ventas del cuarto 
trimestre son las mayores, y las del segundo trimestre, las menores. Además, hay un aumento 
moderado de las ventas de un año al siguiente. Para detectar esta característica basta obser- 
var los valores de las ventas de todos los cuartos trimestres. Durante el periodo de seis años, 
las ventas en el cuarto trimestre aumentaron. Si une estos puntos en su mente, visualizará el 
incremento de las ventas en el cuarto trimestre de 2010. 



GRÁFICA 16-8 Ventas trimestrales de Toys International, 2004-2009 

Para determinar los índices estacionales trimestrales se deben dar seis pasos. 

Paso 1: Para el siguiente análisis consulte la tabla 16-7. El primer paso es determinar el 
total móvil del cuarto trimestre de 2004. Inicie con el trimestre invernal de 2004, 
sume $6.7, $4.6, $10.0 y $12.7. El total es $34.0 (millones). El total del cuarto tri- 
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TABLA 16-7 Cálculos necesarios para índices estacionales específicos 




(D 

(2) 

(3) 

(4) 

(5) 



Ventas 

Total 

Promedio móvil 

Promedio 




(millones 

del cuarto 

del cuarto 

móvil 

Estacional 

Año 

Trimestre 

de dólares) 

trimestre 

trimestre 

centrado 

especifico 

2004 

Invierno 

6.7 






Primavera 

4.6 

34.0 

8.500 




Verano 

10.0 

33.8 

8.450 

8.475 

1.180 


Otoño 

12.7 

33.8 

8.450 

8.450 

1.503 

2005 

Invierno 

6.5 

33.6 

8.400 

8.425 

0.772 


Primavera 

4.6 

34.5 

8.625 

8.513 

0.540 


Verano 

9.8 

34.9 

8.725 

8.675 

1.130 


Otoño 

13.6 

35.3 

8.825 

8.775 

1.550 

2006 

Invierno 

6.9 

35.9 

8.975 

8.900 

0.775 


Primavera 

5.0 

36.4 

9.100 

9.038 

0.553 


Verano 

10.4 

36.5 

9.125 

9.113 

1.141 


Otoño 

14.1 

37.0 

9.250 

9.188 

1.535 

2007 

Invierno 

7.0 

37.4 

9.350 

9.300 

0.753 


Primavera 

5.5 

38.3 

9.575 

9.463 

0.581 


Verano 

10.8 

38.4 

9.600 

9.588 

1.126 


Otoño 

15.0 

38.6 

9.650 

9.625 

1.558 

2008 

Invierno 

7.1 

38.9 

9.725 

9.688 

0.733 


Primavera 

5.7 

38.4 

9.600 

9.663 

0.590 


Verano 

11.1 

39.3 

9.825 

9.713 

1.143 


Otoño 

14.5 

39.8 

9.950 

9.888 

1.466 

2009 

Invierno 

8.0 

40.1 

10.025 

9.888 

0.801 


Primavera 

6.2 

40.5 

10.125 

10.075 

0.615 


Verano 

11.4 






Otoño 

14.9 
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mestre “se desplaza” al sumar las ventas de primavera, verano y otoño de 2004 
a las ventas de invierno de 2005. El total es $33.8 (millones), determinado por 4.6 
+ 10.0 + 12.7 + 6.5. Este procedimiento se aplica a las ventas trimestrales de 
cada uno de los seis años. En la columna 2 de la tabla 16-7 aparecen los totales 
móviles. Observe que el total móvil, 34.0, se coloca entre las ventas de primave- 
ra y verano de 2004; el siguiente total móvil, 33.8, se coloca entre las ventas del 
verano y otoño de 2004, etc. Verifique los totales con frecuencia para evitar erro- 
res aritméticos. 

Paso 2: Cada total móvil trimestral en la columna 2 se divide entre 4 para obtener el pro- 
medio móvil trimestral. (Vea la columna 3.) Todos los promedios móviles aún están 
colocados entre los trimestres. Por ejemplo, el primer promedio móvil (8.500) se 
coloca entre la primavera y el verano de 2004. 

Paso 3: Se centran los promedios móviles. El primer promedio móvil centrado se determi- 
na mediante (8.500 + 8.450J/2 = 8.475, y se centra en oposición al verano de 
2004. El segundo promedio móvil se determina mediante (8.450 + 8.450J/2 = 
8.450. Los otros se determinan de manera similar. Observe en la columna 4 que 
cada promedio móvil centrado se coloca en un trimestre en particular. 

Paso 4: Luego calcule el índice estacional específico por cada trimestre dividiendo las 
ventas en la columna 1 entre el promedio móvil centrado en la columna 4. El índi- 
ce estacional específico reporta la razón del valor de la serie de tiempo original 
con el promedio móvil. Para explicar esta cuestión un poco más, si representa la 
señe de tiempo con TSCI y el promedio móvil con TC, de manera algebraica, si 
calcula TSCI/TC, el resultado es el componente estacional específico SI. El índi- 
ce estacional específico del trimestre del verano de 2004 es 1.180, determinado 
por 10.0/8.475. 

Paso 5: Los índices estacionales específicos aparecen organizados en la tabla 16-8. Esta 
tabla ayuda a ubicar los estacionales específicos de los trimestres correspondien- 
tes. Los valores 1 .180, 1.130, 1.141, 1.126 y 1.143 representan estimaciones del 
índice estacional habitual del trimestre de verano. Un método razonable para 
encontrar un índice estacional habitual es promediar estos valores a fin de elimi- 
nar el componente irregular. Por lo tanto, el índice habitual del trimestre de vera- 
no se determina mediante (1.180 + 1.130 + 1.141 + 1.126 + 1.143)/5 = 1.144. 
Se utilizó la media aritmética, aunque también pudo emplear la mediana o una 
media modificada. 


TABLA 16-8 Cálculos necesarios para determinar índices trimestrales habituales 


Año 

Invierno 

Primavera 

Verano 

Otoño 


2004 



1.180 

1.503 


2005 

0.772 

0.540 

1.130 

1.550 


2006 

0.775 

0.553 

1.141 

1.535 


2007 

0.753 

0.581 

1.126 

1.558 


2008 

0.733 

0.590 

1.143 

1.466 


2009 

0.801 

0.615 




Total 

3.834 

2.879 

5.720 

7.612 


Media 

0.767 

0.576 

1.144 

1.522 

4.009 

Ajustado 

0.765 

0.575 

1.141 

1.519 

4.000 

índice 

76.5 

57.5 

114.1 

151.9 



Paso 6: En teoría, las cuatro medias trimestrales (0.767, 0.576, 1.144 y 1.522) deberán 
totalizar 4.00, pues el promedio se fija en 1 .0. El total de las cuatro medias trimes- 
trales quizá no sea exactamente igual a 4.00 debido al redondeo. En este proble- 
ma, el total de las medias es 4.009. Por lo tanto, se aplica un factor de corrección 
a cada una de las cuatro medias para que sumen 4.00. 
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FACTOR DE CORRECCIÓN 

PARA AJUSTAR MEDIAS Factor de corrección 

TRIMESTRALES 


400 

Total de cuatro medias 


(16-3) 




En este ejemplo, 

4.00 

Factor de corrección = = 0.997755 

4.009 

Por lo tanto, el índice trimestral ajustado de invierno es .767(.997755) = .765. Cada una de las 
medias se ajusta hacia abajo de modo que el total de nuestras medias trimestrales sea 4.00. 
En general, los índices se reportan como porcentajes, por lo que cada valor en la última fila de 
la tabla 16-8 se multiplica por 100. Así, el índice del trimestre de invierno es 76.5, y del verano, 
1 51 .9. ¿Cómo se interpretan estos valores? Las ventas del trimestre de otoño están 51 .9% por 
arriba de un trimestre habitual, y del invierno, 23.5% por debajo (100.0 - 76.5). Estos resulta- 
dos no deben sorprender. En el periodo anterior a Navidad (el trimestre de otoño) son más altas 
las ventas de juguetes. Después de Navidad (el trimestre de invierno), las ventas de juguetes 
declinan de forma drástica. 


Como se dijo antes, hay software para realizar los cálculos con salida en pantalla de los 
resultados. La captura de pantalla de MegaStat Excel se muestra en seguida. El uso de soft- 
ware reducirá en gran medida el tiempo de cómputo y la posibilidad de cometer un error en 
los cálculos aritméticos, pero debe comprender los pasos del proceso. Puede haber diferen- 
cias ligeras en las respuestas, debido al número de dígitos manejados en los cálculos. 


Promedio móvil centrado y desestacionalización 

Promedio 

móvil 

t Año Trimestre Ventas centrado 

Razón para 
el promedio 
móvil 
centrado 

índices 

estacionales 

Ventas 

desestacionalizadas 

1 

2004 

1 

6.70 



0.765 

8.759 

2 

2004 

2 

4.60 



0.575 

8.004 

3 

2004 

3 

10.00 

8.475 

1.180 

1.141 

8.761 

4 

2004 

4 

12.70 

8.450 

1.503 

1.519 

8.361 

5 

2005 

1 

6.50 

8.425 

0.772 

0.765 

8.498 

6 

2005 

2 

4.60 

8.513 

0.540 

0.575 

8.004 

7 

2005 

3 

9.80 

8.675 

1.130 

1.141 

8.586 

8 

2005 

4 

13.60 

8.775 

1.550 

1.519 

8.953 

9 

2006 

1 

6.90 

8.900 

0.775 

0.765 

9.021 

10 

2006 

2 

5.00 

9.038 

0.553 

0.575 

8.700 

11 

2006 

3 

10.40 

9.113 

1.141 

1.141 

9.112 

12 

2006 

4 

14.10 

9.188 

1.535 

1.519 

9.283 

13 

2007 

1 

7.00 

9.300 

0.753 

0.765 

9.151 

14 

2007 

2 

5.50 

9.463 

0.581 

0.575 

9.570 

15 

2007 

3 

10.80 

9.588 

1.126 

1.141 

9.462 

16 

2007 

4 

15.00 

9.625 

1.558 

1.519 

9.875 

17 

2008 

1 

7.10 

9.688 

0.733 

0.765 

9.282 

18 

2008 

2 

5.70 

9.663 

0.590 

0.575 

9.918 

19 

2008 

3 

11.10 

9.713 

1.143 

1.141 

9.725 

20 

2008 

4 

14.50 

9.888 

1.466 

1.519 

9.546 

21 

2009 

1 

8.00 

9.988 

0.801 

0.765 

10.459 

22 

2009 

2 

6.20 

10.075 

0.615 

0.575 

10.788 

23 

2009 

3 

11.40 



1.141 

9.988 

24 

2009 

4 

14.90 



1.519 

9.809 
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Cálculo de los 

índices estacionales 



1 

2 

3 

4 

2004 



1.180 

1.503 


2005 

0.772 

0.540 

1.130 

1.550 


2006 

0.775 

0.553 

1.141 

1.535 


2007 

0.753 

0.581 

1.126 

1.558 


2008 

0.733 

0.590 

1.143 

1.466 


2009 

0.801 

0.615 




Media: 

0.767 

0.576 

1.144 

1.522 

4.009 

Ajustada: 

0.765 

0.575 

1.141 

1.519 

4.000 


Resumamos ahora de forma breve el razonamiento de los cálculos anteriores. Los datos 
originales en la columna 1 de la tabla 16-7 contienen los componentes de tendencia (7), cícli- 
ca (C), estacional (S) e irregular (/). El objetivo principal es eliminar la variación estacional (S) 
de la valuación de las ventas originales. 

De las columnas 2 y 3 de la tabla 16-7 se deriva el promedio móvil centrado dado en la 
columna 4. En esencia, “quedan fuera” las fluctuaciones estacional e irregular de los datos ori- 
ginales en la columna 1. Por lo tanto, en la columna sólo quedan las variaciones por tenden- 
cia y la cíclica ( TC ). 

En seguida, divida los datos de ventas en la columna 1 (TCSI) entre el promedio móvil cen- 
trado del tercer trimestre en la columna 4 (TC) para llegar a las variaciones estacionales espe- 
cíficas en la columna 5 (SI). En términos de letras, TCSI/TC = SI. Multiplique SI por 100.0 para 
expresar la variación estacional típica en forma de índice. 

En el último paso, tome la medida de todos los índices comunes de invierno, de todos los 
índices de primavera, etc. Este promedio elimina la mayoría de las fluctuaciones Irregulares de 
las variaciones estacionales específicas, y los cuatro índices resultantes indican el patrón 
de ventas estacional típico. 



En Tetón Village, Wyoming, cerca del Granó Tetón Park y Yellowstone Park, hay tiendas, restauran- 
tes y moteles. Tiene dos estaciones altas, una en invierno, para esquiar en las pendientes de 
10 000 pies de declive, y la otra en verano, para los turistas que visitan los parques. El número de 
visitantes (en miles) por trimestre en cinco años es el siguiente. 


Año 


Trimestre 


Invierno 

Primavera 

Verano 

Otoño 

2006 

117.0 

80.7 

129.6 

76.1 

2007 

118.6 

82.5 

121.4 

77.0 

2008 

114.0 

84.3 

119.9 

75.0 

2009 

120.7 

79.6 

130.7 

69.6 

2010 

125.2 

80.2 

127.6 

72.0 


a) Desarrolle el patrón estacional habitual de Tetón Village con el método de la razón con promedio 
móvil. 

b) Explique el índice habitual de la temporada de invierno. 


comect 


Ejercicios 

9. Victor Anderson, propietario de Anderson Belts, Inc., estudia el ausentismo entre sus empleados. 
Su fuerza laboral es pequeña, de sólo cinco empleados. Durante los últimos tres años registró el 
siguiente número de ausencias entre sus empleados, en días, por trimestre. 
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OA7 Desestacionalizar 
datos mediante un índice 
estacional. 


Año 


Trimestre 


1 

II 

III 

IV 

2008 

4 

10 

7 

3 

2009 

5 

12 

9 

4 

2010 

6 

16 

12 

4 


Determine el índice estacional habitual de cada uno de los cuatro trimestres. 

10. Appliance Center vende diversos aparatos domésticos y equipo electrónico. En los últimos cuatro 
trimestres reportó las siguientes ventas trimestrales (en millones de dólares). 


Año 


Trimestre 


1 

II 

III 

IV 

2007 

5.3 

4.1 

6.8 

6.7 

2008 

4.8 

3.8 

5.6 

6.8 

2009 

4.3 

3.8 

5.7 

6.0 

2010 

5.6 

4.6 

6.4 

5.9 


Determine un índice estacional habitual de cada uno de los cuatro trimestres. 


16.9 Datos desestacionalizados 

Por ejemplo, un conjunto de índices habituales es muy útil para ajustar las series de ventas de 
fluctuaciones estacionales. La serie de ventas resultantes se denominan ventas desestacio- 
nalizadas o estacionalmente ajustadas. La razón para desestacionalizar la serie de ventas 
es eliminar las fluctuaciones estacionales de modo que sea posible estudiar la tendencia y el 
ciclo. Para ilustrar el procedimiento, los totales de las ventas trimestrales de Toys International 
de la tabla 16-6 aparecen en la columna 1 de la tabla 16-9. 


TABLA 16-9 Ventas reales y desestacionalizadas de Toys International 


Año 

Trimestre 

(D 

Ventas 

, W 

índice 

estacional 

(3) 

Ventas 

desestacionalizadas 

2004 

Invierno 

6.7 

0.765 

8.76 


Primavera 

4.6 

0.575 

8.00 


Verano 

10.0 

1.141 

8.76 


Otoño 

12.7 

1.519 

8.36 

2005 

Invierno 

6.5 

0.765 

8.50 


Primavera 

4.6 

0.575 

8.00 


Verano 

9.8 

1.141 

8.59 


Otoño 

13.6 

1.519 

8.95 

2006 

Invierno 

6.9 

0.765 

9.02 


Primavera 

5.0 

0.575 

8.70 


Verano 

10.4 

1.141 

9.11 


Otoño 

14.1 

1.519 

9.28 

2007 

Invierno 

7.0 

0.765 

9.15 


Primavera 

5.5 

0.575 

9.57 


Verano 

10.8 

1.141 

9.47 


Otoño 

15.0 

1.519 

9.87 

(continúa) 
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OA8 Calcular proyecciones 
estacionalmente ajustadas. 


Año 

Trimestre 

(D 

Ventas 

. < 2 > 
índice 

estacional 

(3) 

Ventas 

desestacionalizadas 

2008 

Invierno 

7.1 

0.765 

9.28 


Primavera 

5.7 

0.575 

9.91 


Verano 

11.1 

1.141 

9.73 


Otoño 

14.5 

1.519 

9.55 

2009 

Invierno 

8.0 

0.765 

10.46 


Primavera 

6.2 

0.575 

10.79 


Verano 

11.4 

1.141 

9.99 


Otoño 

14.9 

1.519 

9.81 


Para eliminar el efecto de la variación estacional, la cantidad de ventas en cada trimestre 
(con los efectos de tendencia, cíclicos, irregulares y estacionales) se divide entre el índice esta- 
cional de ese trimestre, es decir, TSCI/S. Por ejemplo, las ventas reales del primer trimestre de 
2004 fueron de $6.7 millones. El índice estacional del trimestre de invierno es 76.5%, con los 
resultados de MegaStat de la página 626. El índice de 76.5 indica que las ventas del primer 
trimestre están habitualmente 23.5% debajo del promedio de un trimestre típico. Al dividir las 
ventas reales de $6.7 millones entre 76.5, y multiplicar el resultado por 100, se obtienen las 
ventas desestacionalizadas, es decir, se elimina el efecto estacional sobre las ventas, del pri- 
mer trimestre de 2004. Éste es $8 758 170, determinado mediante ($6 700 000/76.5)100. 
Continúe este proceso con los demás trimestres en la columna 3 de la tabla 16-9, con los 
resultados reportados en millones de dólares. Como ha eliminado (cancelado) el componente 
estacional de las ventas trimestrales, la cifra de las ventas desestacionalizadas sólo contiene 
los componentes de tendencia (7), cíclica (C) e irregular (/). Al analizar las ventas desestacio- 
nallzadas en la columna 3 de la tabla 16-9, observe que las ventas de juguetes mostraron un 
aumento moderado durante el periodo de seis años. En la gráfica 1 6-9 aparecen tanto las ven- 
tas reales como las desestacionalizadas. Es claro que eliminar el factor estacional permite 
enfocarse en la tendencia general de largo plazo de las ventas. También puede determinar la 
ecuación de regresión de los datos de la tendencia y con ella proyectar ventas futuras. 



GRAFICA 16-9 Ventas reales y desestacionalizadas de Toys International, 2004 a 2009 


Uso de datos desestacionalizados para proyección 

El procedimiento para Identificar la tendencia y los ajustes estacionales se combina para pro- 
ducir proyecciones estaclonalmente ajustadas. Para Identificar la tendencia, determine la 
ecuación de la tendencia de mínimos cuadrados en los datos históricos desestacionalizados. 
Luego proyecte esta tendencia en periodos futuros, y después ajuste las tendencias de los 
valores para calcular los factores estacionales. El siguiente ejemplo lo aclara. 
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Cjemplo 

Solución 



Estadística en acción 

Las proyecciones no 
siempre son correctas. La 
realidad es que una pro- 
yección puede ser sólo 
una mejor suposición res- 
pecto de lo que sucederá. 
¿Por qué no son correctas 
las proyecciones? Un 
experto enumera ocho 
errores comunes: 1) no 
examinar con cuidado las 
suposiciones, 2) experien- 
cia limitada, 3) falta de 
imaginación, 4) olvido de 
las restricciones, 5) opti- 
mismo excesivo, 6) 
dependencia en la extra- 
polación mecánica, 7) 
cierre prematuro y 8) 
especificar demasiado. 

V 


Toys International quiere proyectar sus ventas de cada trimestre de 2010. Con la información 
de la tabla 16-9 determine la proyección. 


Los datos desestacionalizados, que se ilustran en la gráfica 16-9, parecen seguir una recta. De 
aquí que sea razonable desarrollar una ecuación de tendencia lineal con base en estos datos. 
La ecuación de la tendencia desestacionalizada es: 

Y= a + bt 

donde: 

Y es el valor de la tendencia estimado de las ventas de Toys International durante el perio- 
do t. 

a es la intersección de la recta de la tendencia en el tiempo 0. 
b es la pendiente de la recta. 
t es el periodo de tiempo codificado. 

El trimestre de invierno de 2004 es el primer trimestre, por lo cual se codifica como 1, el tri- 
mestre de primavera de 2004 se codifica como 2, etc. El último trimestre de 2009 se codifica 
como 24. Estos valores de los códigos aparecen en la sección de datos de la captura de pan- 
talla de Minitab asociada con la gráfica 16-9. 

Se emplea Minitab para encontrar la ecuación de regresión. La siguiente es la captura de 
pantalla. En ella se incluye un diagrama de dispersión de los periodos de tiempo codificados 
y las ventas desestacionalizadas, así como la recta de regresión. 

La ecuación de la recta de regresión es: 

Y= 8.109 + .08991 1 


La pendiente de la recta de tendencia es 0.08991 . Esto indica que durante los 24 trimes- 
tres las ventas desestacionalizadas aumentaron a una tasa de 0.08991 (millones de dólares) 
por trimestre u $89 910 por trimestre. El valor de 8.109 es la intersección de la recta de ten- 
dencia con el eje Y (es decir, para t = 0). 



El sistema Minitab también da salida al coeficiente de determinación. Este valor, denomi- 
nado R 2 , es 78.6%. Se muestra arriba a la derecha de la captura de pantalla de Minitab. Este 
valor sirve como una indicación del ajuste de los datos. Como ésta no es información de la 
muestra, técnicamente no debería utilizarse R 2 para juzgar una ecuación de regresión. Sin 
embargo, servirá para evaluar de manera rápida el ajuste de los datos de ventas desestacio- 
nalizadas. En este caso, como R 2 es un tanto grande, se concluye que las ventas desesta- 
cionalizadas de Toys International se explican de manera clara mediante una ecuación de 
tendencia lineal. 

Si supone que los últimos 24 periodos son un buen indicador de las ventas futuras, utili- 
ce la ecuación de la tendencia para estimar las ventas futuras. Por ejemplo, el valor de t en el 
trimestre de invierno de 2010 es 25. Por lo tanto, las ventas estimadas de ese periodo suman 
10.35675, determinadas mediante 

Y= 8.109 + .08991 f = 8.109 + .08991(25) = 10.35675 

Las ventas desestacionalizadas estimadas del trimestre de invierno de 2010 alcanzan 
$10 356 750. Ésta es la proyección de ventas antes de considerar los efectos de las tempora- 
das. 
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Utilice el mismo procedimiento y una hoja de cálculo de Excel para determinar la proyec- 
ción de cada uno de los cuatro trimestres de 2010. Una captura parcial de pantalla de Excel es 
la siguiente. 



®¡]quarterty forecasts 

a e c D E f G 

1 

2 
3 


4 

5 

6 

7 

8 
9 


Quarterty Forecast forToy* International 
2010 


Quarter t valué 


Estimated Seasonal 
Sales índex 


Wünttr 

23 

10.3365 

0 765 

Sprtng 

26 

10.4464 

0.375 

Summer 

27 

103363 

1.141 

Fall 

28 

10.6262 

1.519 



Ahora que ya tiene las predicciones de los cuatro trimestres de 201 0, las puede ajustar a 
las temporadas. El índice de un trimestre de invierno es 0.765. Por ende, puede ajustar por 
temporada la proyección del trimestre de invierno de 2010 mediante 10.35675(0.765) = 7.923. 
Las estimaciones de cada uno de los cuatro trimestres de 2010 aparecen en la columna dere- 
cha de la captura de pantalla de Excel. Observe cómo los ajustes estacionales aumentan de 
forma drástica las estimaciones de ventas de los dos últimos trimestres del año. 


r 


Autoevaluación 


16-5 


Westberg Electric Company vende motores eléctricos a clientes en el área de Jamestown, Nueva 
Jersey. La ecuación de la tendencia mensual, con base en cinco años de datos mensuales, es 


Y =4.4 + 0.5 f 


El factor estacional de enero es 120, y 95 el de febrero. Determine la proyección estacional ajustada 
de enero y febrero del sexto año. 



comed: 


Ejercicios 

11. El departamento de planeación de Padget and Kure Shoes, fabricante de una marca exclusiva de 
zapatos para mujeres, desarrolló la siguiente ecuación de la tendencia, en millones de pares, con 
base en cinco años de datos trimestrales. 

Y= 3.30 + 1.75Í 

En la siguiente tabla aparecen los factores estacionales de cada trimestre. 




Trimestre 



1 

II III 

IV 

índice 

110.0 

120.0 80.0 

90.0 


Determine la proyección ajustada por temporada de cada uno de los cuatro trimestres de los seis 
años. 

12 . Team Sports, Inc., vende artículos deportivos a preparatorias y universidades por medio de un 
catálogo de distribución nacional. La gerencia de la empresa Sports estima que venderá 2 000 
guantes de “catcher” marca Wilson Modelo A2000 el próximo año. Las ventas desestacionaliza- 
das proyectadas del año próximo serán iguales en cada uno de los cuatro trimestres. El factor 
estacional del segundo trimestre es 1 45. Determine las ventas ajustadas por temporada del segun- 
do trimestre del próximo año. 
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OA9 Probar la 
autocorrelación. 


13. Consulte el ejercicio 9, respecto de las ausencias en Anderson Belts, Inc. Utilice los índices esta- 
cionales que calculó para determinar las ausencias desestacionalizadas. Determine la ecuación 
de la tendencia lineal con base en los datos trimestrales de los tres años. Proyecte las ausen- 
cias de 201 1 ajustadas por temporada. 

14. Consulte el ejercicio 10, respecto de las ventas de Appliance Center. Utilice los índices estaciona- 
les que calculó para determinar las ventas desestacionalizadas. Determine la ecuación de la ten- 
dencia lineal de los cuatro años con base en los datos trimestrales. Proyecte las ventas de 201 1 
ajustadas por temporada. 

16.10 El estadístico de Durbin-Watson 

Los datos u observaciones de serles de tiempo recopiladas sucesivamente durante un perio- 
do presentan una dificultad particular cuando se utiliza la regresión. Una de las suposiciones 
que por tradición se emplean en la regresión es que los residuos sucesivos son independien- 
tes. Esto significa que los residuos no siguen un patrón, los residuos no están altamente corre- 
lacionados, y no hay corridas largas de residuos positivos o negativos. En la gráfica 16-10, los 
residuos aparecen a escala en el eje vertical, y los valores Y, a lo largo del eje horizontal. 
Observe que hay “corridas” de residuos arriba y debajo de la recta 0. Si calcula la correlación 
entre residuos sucesivos, es probable que la correlación sea fuerte. 



GRAFICA 16-10 Residuos correlacionados 


Esta condición se denomina autocorrelación, o correlación en serie. 


O 


3 


AUTOCORRELACIÓN Los residuos sucesivos están correlacionados. 


Los residuos sucesivos están correlacionados en datos de series de tiempo debido a que 
un evento de un periodo influye sobre el evento del siguiente. Para explicar esto, el propieta- 
rio de una mueblería decide obtener una venta especial este mes y gasta una cantidad consi- 
derable de dinero en publicidad. Esperaría una correlación entre las ventas y el gasto 
publicitario, pero no todos los resultados del aumento de publicidad se experimentarán este 
mes. Es probable que una parte de su efecto se observe en el mes siguiente. En consecuen- 
cia, espere una correlación entre los residuos. 

La relación de regresión en una serie de tiempo se escribe: 

Y t = a + P-|X ( + Ef 

donde el subíndice t sustituye a i para sugerir que los datos se recopilaron en el tiempo. 

Si los residuos están correlacionados, se originan problemas cuando se intenta realizar 
pruebas de hipótesis respecto de los coeficientes de regresión. Asimismo, un intervalo de con- 
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fianza o un intervalo de proyección, donde se use el error estándar de estimación múltiple, 
quizá no produzca los resultados correctos. 

La autocorrelación, reportada como r, es la fuerza de la asociación entre residuos sucesi- 
vos. Lar tiene el mismo significado que el coeficiente de correlación. Es decir, los valores cer- 
canos a -1.00 o 1.00 indican una asociación fuerte, y los valores cercanos a 0, que no hay 
asociación. En lugar de realizar de manera directa una prueba de hipótesis en r, se emplea el 

estadístico de Durbin-Watson. 

El estadístico de Durbin-Watson, identificado con la letra d, se calcula primero al determi- 
nar los residuos por cada observación. Es decir, e t = ( Y t - Y t ). Luego, se calcula d mediante 
la siguiente relación. 


ESTADÍSTICO DE DURBIN-WATSON 


E - e (-i) 2 

t = 2 

i » 2 

t=^ 




( 16 - 4 ) 


y 


Para determinar el numerador de la fórmula (16-4), “retarde” cada uno de los residuos un 
periodo y luego eleve al cuadrado la diferencia entre residuos consecutivos. Esta maniobra, a 
la que también se le puede llamar determinación de las diferencias, toma en cuenta la suma 
de las observaciones de 2, en lugar de 1, hasta n. En el denominador se elevan al cuadrado 
los residuos y se suman todas las observaciones n. 

El valor del estadístico de Durbin-Watson, que varía de 0 a 4, es 2.00 cuando no hay auto- 
correlación entre los residuos. Cuando el valor de d se acerca a 0, indica una autocorrelación 
positiva. Los valores mayores que 2 indican una autocorrelación negativa. En la práctica, la 
autocorrelación casi no se presenta. Para que esto ocurra, los residuos sucesivos tenderían a 
ser grandes, pero con signos opuestos. 

Para realizar una prueba de autocorrelación, las hipótesis nula y alternativa son: 

H 0 \ Sin correlación residual (p = 0) 

H - Correlación residual positiva (p > 0) 

Recuerde, del capítulo anterior, que r se refiere a la correlación muestral, y que p es el coefi- 
ciente de correlación entre la población. Los valores críticos de d aparecen en el apéndice 
B.10. Para determinar el valor crítico, necesita a (el nivel de significancia), n (el tamaño mues- 
tral) y k (el número de variables independientes). La regla de decisión de la prueba de Durbin- 
Watson difiere de lo acostumbrado. Como es común, hay un rango de valores donde la 
hipótesis nula se rechaza y otro donde no se rechaza. Sin embargo, también hay un rango 
donde la prueba no es concluyente. Es decir, en el rango no concluyente, la hipótesis nula no 
se rechaza ni se acepta. Para expresarlo de manera más formal: 

• Los valores menores que d, obligan a rechazar la hipótesis nula. 

• Los valores mayores que d u indican que la hipótesis nula no se debe rechazar. 

• Los valores de d entre c/, y d u producen resultados no concluyentes. 

El subíndice / se refiere al límite inferior de d, y el subíndice u, al límite superior. 

¿Cómo interpretar las diversas decisiones de la prueba de correlación residual? Si no se 
rechaza la hipótesis nula, se concluye que no hay autocorrelación. Los residuos no están 
correlacionados, no hay autocorrelación y se cumple con la suposición de regresión. No habrá 
problemas con el valor estimado del error estándar de estimación. Si la hipótesis nula se 
rechaza, se concluye que hay autocorrelación. 

El remedio común de la autocorrelación es incluir otra variable de predicción que capture 
el orden de tiempo. Por ejemplo, puede utilizar la raíz cuadrada de Y en lugar de Y. Esta trans- 
formación generará un cambio en la distribución de los residuos. Si el resultado aparece en el 
rango no concluyente, será necesario recurrir a pruebas más elaboradas, o, de manera con- 
servadora, considerar el rechazo de la hipótesis nula. 

Un ejemplo ilustrará los detalles de la prueba de Durbin-Watson y cómo se interpretan los 
resultados. 
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Cjemplo 


Solución 


Banner Rocker Company fabrica y comerciali- 
za mecedoras. La compañía diseñó una mece- 
dora especial para adultos mayores, que 
anuncia en la televisión. El mercado de la silla 
especial se encuentra en los estados de 
Carolina del Norte, Carolina del Sur, Florida y 
Arizona, donde viven muchos adultos mayores 
y jubilados. El presidente de Banner Rocker 
estudia la asociación entre sus gastos en publi- 
cidad (X) y el número de mecedoras vendidas 
en los últimos 20 meses (V), para lo cual reco- 
piló los siguientes datos. A él le gustaría elabo- 
rar un modelo para proyectar las ventas, con base en la cantidad que la empresa gastó en 
publicidad, pero le preocupa que, como reunió estos datos durante meses consecutivos, 
pueda tener problemas con la autocorrelación. 



Mes 

Ventas 
(en miles) 

Publicidad (en 
millones de dólares) 

Mes 

Ventas 
(en miles) 

Publicidad (en 
millones de dólares) 

1 

153 

$5.5 

11 

169 

$6.3 

2 

156 

5.5 

12 

176 

5.9 

3 

153 

5.3 

13 

176 

6.1 

4 

147 

5.5 

14 

179 

6.2 

5 

159 

5.4 

15 

184 

6.2 

6 

160 

5.3 

16 

181 

6.5 

7 

147 

5.5 

17 

192 

6.7 

8 

147 

5.7 

18 

205 

6.9 

9 

152 

5.9 

19 

215 

6.5 

10 

160 

6.2 

20 

209 

6.4 


Determine la ecuación de regresión. ¿Es la publicidad un buen factor de proyección de las ven- 
tas? Si el propietario aumentara la cantidad gastada en publicidad $1 000 000, ¿cuántas sillas 
adicionales esperaría vender? Investigue la posibilidad de autocorrelación. 

El primer paso es determinar la ecuación de regresión. 

Análisis de regresión: mecedoras (miles) frente a publicidad 
(millones de dólares) 

La ecuación de regresión es 

Mecedoras (miles) = —43.8 + 36.0 Publicidad (millones de dólares) 


Factor de 

predicción Coef 

Constante —43.80 

Publicidad (millones 
de dólares) 35.950 

S = 12.3474 R 2 = 68.5% R 2 

Análisis de la varianza 


SE Coef 
34.44 


T 

-1.27 


5.746 6.26 

(ajust) = 66.8% 


Fuente DF SS MS F 
Regresión 1 5967.7 5967.7 39.14 
Error residual 18 2744.3 152.5 


P 

0.220 


0 . 000 


P 

0 . 000 


El coeficiente de determinación es 68.5%. Por lo tanto, hay una asociación positiva fuerte entre 
las variables. La conclusión es que, conforme aumenta la cantidad gastada en publicidad, se 
venderán más mecedoras. Por supuesto, esto es lo que se esperaba. 
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¿Cuántas mecedoras más se venderán si los gastos en publicidad aumentan $1 000 000? 
Debe tener cuidado con las unidades de los datos. Las ventas están en miles de mecedoras, 
y el gasto en publicidad, en millones de dólares. La ecuación de regresión es: 

Y = -43.80 + 35.950X 

Esta ecuación indica que un aumento de 1 en X dará como resultado un aumento de 35.95 en 
Y. En consecuencia, un aumento de $1 000 000 en publicidad aumentará las ventas en 35 950 
mecedoras. En otras palabras, costará $27.82 en gastos publicitarios adicionales vender una 
mecedora, lo cual se determina por $1 000 000/35 950. 

¿Qué sucede con el problema potencial de autocorrelación? Muchos paquetes de soft- 
ware, como Minitab, calcularán el valor de la prueba de Durbin-Watson y darán salida a los 
resultados. Para comprender la naturaleza de la prueba y ver los detalles de la fórmula (16-4), 
se utiliza una hoja de cálculo de Excel. 


•v)[ 

)urbin-Watson 







A 

a 

C 

0 

i 

f 

O 

N | 

1 


i 

! 

? 

i 

UU«! 



2 

Montti 

V 

X 

♦ 

», «r-0 




1 

1 

151 

51 

; • ■ • 

09217 



0.8511 

4 

2 

156 

U 

153.92366 

2.0781 

•0.9237 

9.0000 

45112 

5 

) 

153 

5.3 

146.7336221 

6.2664 

2.0763 

175564 

39.2675 

6 

4 

147 

5.5 

151.92166 

•4.9217 

6.2664 

171.9771 

47.9171 

7 

s 

159 

54 

150.326641 

8.6714 

■6.9217 

243.2046 

751925 

8 

e 

160 

5.3 

146.7336221 

13.2664 

8.6714 

71.1142 

175.9968 

♦ 

i 

147 

5.5 

151.92166 

6.9217 

11.2664 

407.6176 

47.9171 

10 

8 

147 

5.7 

161.1110979 

•14.1117 

6.9217 

51.6946 

199.1965 

11 

1 

152 

5.9 

168.3037358 

•16.3037 

•14.1137 

4.7963 

265.8118 

12 

10 

160 

6.2 

179.0667926 

-19.0688 

-161017 

7.7565 

364.1620 

1) 

u 

169 

6.1 

182.6618116 

•11.6618 

19.0688 

29.2118 

1874467 

14 

12 

176 

5.9 

168.3037358 

7.6963 

136638 

457.1076 

59-2325 

15 

13 

176 

6.1 

1754937737 

05062 

7.6963 

51.6966 

04563 

16 

14 

179 

6.2 

179.0687926 

00668 

0.5062 

0.3540 

0.0079 

17 

15 

164 

6.2 

179.0667926 

4.9112 

•O.Ottt 

250000 

24.1200 

18 

16 

161 

65 

189.8716495 

•8,6716 

4.9112 

190.0278 

78.7452 

19 

17 

192 

6.7 

197.0638874 

-5.0639 

•84736 

145158 

256430 

JO 

1* 

jos 

6.9 

204.2539251 

0.7461 

•5 0639 

337557 

0.5566 

Í1 

1» 

215 

6.5 

189.8718495 

25.1262 

0.7461 

594.1881 

611.1234 

22 

20 

209 

64 

186.2788305 

22.7212 

25.1262 

5.7839 

516.2513 

23 










Para investigar la posibilidad de autocorrelación es necesario determinar los residuos de cada 
observación, encontrar los valores ajustados, es decir, Y, en cada uno de los 20 meses. Esta 
información aparece en la cuarta columna, la D. Luego se encuentra el residuo, que es la dife- 
rencia entre el valor real y los valores ajustados. Por lo tanto, en el primer mes: 

Y = -43.80 + 35.950X = -43.80 + 35.950(5.5) = 153.925 

e-, = Y 1 - Y, = 153 - 153.925 = -0.925 

El residuo, reportado en la columna E, es un poco diferente debido al redondeo del software. 
Observe en particular la serie de cinco residuos negativos en las filas 9 a 13. En la columna F 


16.10 El estadístico de Durbin-Watson 


635 


los residuos se retrasan un periodo. En la columna G se determina la diferencia entre el resi- 
duo actual y el anterior, y se la eleva al cuadrado. Con los valores del software: 

(e, - e t _i) 2 = (e 2 - e 2 _ 1 ) 2 = [2.0763 - (-0.9237)] 2 = (3.0000) 2 = 9.0000 

El resto de los valores de la columna G se determina de igual forma. Los valores de la colum- 
na H son los cuadrados de los valores de la columna E. 

(e^ 2 = (-0.9237) 2 = 0.8531 


Para encontrar el valor de d necesita las sumas de las columnas G y H. Estas sumas están 
resaltadas en color amarillo en la hoja de cálculo. 


E ( e f _ e f-i ) 2 

t = 2 

Í » 2 

f=i 


2338.583 

2744.269 


0.8522 


Ahora, para responder la pregunta respecto de si la autocorrelación es significativa, las hipó- 
tesis nula y alternativa se formulan como sigue. 


H 0 : Sin correlación residual 
Correlación residual positiva 


El valor crítico de d aparece en el apéndice B.10, del cual una parte se muestra a continua- 
ción. Hay una variable independiente, por lo que k = 1, el nivel de significancia es 0.05 y el 
tamaño de la muestra, 20. En la tabla 0.05, ahora hay que desplazarse a la columna de k = 1 
y la fila de 20. Los valores reportados son d, = 1 .20 y d u = 1 .41 . Se rechaza la hipótesis nula 
si d < 1 .20 y no se rechaza si d > 1.41. No hay una conclusión si d se encuentra entre 1 .20 y 
1.41. 


n 

k 1 


2 

di 

d u 

di 

d u 

15 

1.08 

1.36 

0.95 

1.54 

16 

1.10 

1.37 

0.98 

1.54 

17 

1.13 

1.38 

1.02 

1.54 

18 

1.16 

1.39 

1.05 

1.53 

19 

1.18 

1.40 

1.08 

1.53 

20 

1.20 

1.41 

1.10 

1.54 

21 

1.22 

1.42 

1.13 

1.54 

22 

1.24 

1.43 

1.15 

1.54 

23 

1.26 

1.44 

1.17 

1.54 

24 

1.27 

1.45 

1.19 

1.55 

25 

1.29 

1.45 

1.21 

1.55 


Autocorrelación Sin 

positiva Indeterminada autocorrelación 


0 [ 


d. 


d u 


d 


|< — Rechace - 


No concluyente 


Se acepta H 0 


0.85 1.20 


1.41 


Puesto que el valor calculado de d es 0.8522, que es menor que d,, rechace la hipótesis nula 
y acepte la hipótesis alternativa. Se concluye que los residuos están autocorrelacionados. Se 
violó una de las suposiciones de regresión. ¿Qué hacer? La existencia de autocorrelación en 
general significa que el modelo de regresión no se especificó de manera correcta. Es proba- 
ble que necesite agregar una o más variables independientes que tengan algunos efectos en 
el orden del tiempo sobre la variable dependiente. La variable independiente más simple que 
aún se debe agregar es una que represente los periodos. 
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Ejercicios 

15. Recuerde el ejercicio 9 del capítulo 14 y la ecuación de regresión para predecir el desempeño en 
el trabajo. Vea la página 544. 

a) Trace los residuos en el orden en el cual se presentan los datos. 

b) Pruebe por autocorrelación con un nivel de significancia de 0.05. 

16. Considere los datos del ejercicio 10 del capítulo 14 y la ecuación de regresión para predecir las 
comisiones ganadas. Vea la página 545. 

a) Trace los residuos en el orden en el cual se presentan los datos. 

b) Pruebe la autocorrelación con un nivel de significancia de 0.01 . 


Resumen del capítulo 

I. Una serie de tiempo es un conjunto de datos durante un periodo. 

A. La tendencia es la dirección de largo plazo de la serie de tiempo. 

B. El componente cíclico es la fluctuación por arriba y por debajo de la recta de tendencia de largo 
plazo durante un periodo mayor. 

C. La variación estacional es el patrón en una serie de tiempo en un año. Estos patrones tienden a 
repetirse año tras año en la mayoría de los negocios. 

D. La variación irregular se divide en dos componentes. 

1. Las variaciones episódicas son impredecibles, pero en general se pueden identificar. Un 
ejemplo es una inundación. 

2. Las variaciones residuales son de naturaleza aleatoria. 

II. Un promedio móvil se utiliza para suavizar la tendencia en una serie de tiempo. 

III. La ecuación de la tendencia lineal es Y = a + bt, donde a es la intersección con el eje Y, b es la 
pendiente de la recta y f es el tiempo codificado. 

A. La ecuación de la tendencia se determina mediante el principio de los mínimos cuadrados. 

B. Si la tendencia no es lineal, sino más bien los incrementos tienden a ser un porcentaje constan- 
te, los valores Y se convierten en logaritmos y con éstos se determina la ecuación de mínimos 
cuadrados. 

IV. Se puede estimar un factor estacional con el método de la razón con el promedio móvil. 

A. El procedimiento de seis pasos produce el índice estacional de cada periodo. 

1. En general, los factores estacionales se calculan por mes o trimestre. 

2. El factor estacional se utiliza para ajustar las proyecciones, tomando en cuenta los efectos 
de la temporada. 

V. El estadístico de Durbin-Watson (16-4) se utiliza para probar si hay autocorrelación. 

Í>t - e t-i ) 2 

d = ^— n (16-4) 

É ( e ,) 2 

f=1 
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Ejercicios del capítulo 

17. Consulte el siguiente diagrama. 
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a) Estime la ecuación de la tendencia lineal de la serie de producción trazando la recta de los 
datos. 

ib) ¿Cuál es el decremento anual promedio de la producción? 

c) Con base en la ecuación de la tendencia, ¿cuál es la proyección para 2014? 

18 . Consulte el siguiente diagrama. 

a) Estime la ecuación de la tendencia lineal de la serie de ingreso personal, 
ib) ¿Cuál es el aumento anual promedio del ingreso personal? 



19. El movimiento de los activos, excepto inversiones en efectivo y de corto plazo, de RNC Company 
de 2000 a 2010 es: 


2000 

2001 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

2010 

1.11 

1.28 

1.17 

1.10 

1.06 

1.14 

1.24 

1.33 

1.38 

1.50 

1.65 


a) Trace los datos. 

b) Determine la ecuación de la tendencia de mínimos cuadrados. 

c) Calcule los puntos de la recta de tendencia de 2003 y 2008, y trace la recta en la gráfica. 

d) Estime el movimiento de los activos en 2015. 

e) ¿Cuánto aumentó el movimiento de activos por año, en promedio, de 2000 a 2010? 

20 . Las ventas, en miles de millones de dólares, de Keller Overhead Door, Inc., de 2005 a 2010 son: 



Año 

Ventas 

Año 

Ventas 

2005 

7.45 

2008 

7.94 

2006 

7.83 

2009 

7.76 

2007 

8.07 

2010 

7.90 


a) Trace los datos. 

b) Determine la ecuación de la tendencia de mínimos cuadrados. 

c) Utilice la ecuación de la tendencia para calcular los puntos de 2007 y 2010. Trace los puntos 
en la gráfica y la recta de regresión. 

d) Estime las ventas netas de 2013. 

e) ¿Cuánto aumentaron (o disminuyeron) las ventas por año, en promedio, durante el periodo? 

21 . El número de empleados, en miles, de Keller Overhead Door, Inc., de 2005 a 2010 es: 


Año 

Empleados 

Año 

Empleados 

2005 

45.6 

2008 

39.3 

2006 

42.2 

2009 

34.0 

2007 

41.1 

2010 

30.0 


a) Trace los datos. 

b) Determine la ecuación de la tendencia de mínimos cuadrados. 

c) Con la ecuación de la tendencia, calcule los puntos de 2007 y 201 0. Trace los puntos en la grá- 
fica y la recta de regresión. 

d) Estime el número de empleados en 2013. 

e) ¿En cuánto aumentó (o disminuyó) el número de empleados por año, en promedio, durante el 
periodo? 
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22 . En la siguiente tabla aparece el precio de venta de las acciones de PepsiCo, Inc., al cierre de año. 



Año 

Precio 

Año 

Precio 

Año 

Precio 

Año 

Precio 

1990 

12.9135 

1995 

27.7538 

2000 

49.5625 

2005 

59.85 

1991 

16.8250 

1996 

29.0581 

2001 

48.68 

2006 

62.00 

1992 

20.6125 

1997 

36.0155 

2002 

42.22 

2007 

77.51 

1993 

20.3024 

1998 

40.6111 

2003 

46.62 

2008 

54.77 

1994 

18.3160 

1999 

35.0230 

2004 

52.20 

2009 

60.80 


a) Trace los datos. 

b) Determine la ecuación de la tendencia de mínimos cuadrados. 

c) Calcule los puntos de 1995 y 2000. 

d) Calcule el precio de venta en 201 1 . ¿Parece una estimación razonable con base en los datos 
históricos? 

e) ¿En cuánto aumentó o disminuyó (por año) el precio accionario, en promedio, durante el perio- 
do? 

23. Si se graficara la siguiente serie de ventas, aparecería curvilínea, lo cual indicaría que las ventas 
aumentan a una tasa (porcentaje) anual un tanto constante. En consecuencia, para ajustar las ven- 
tas se deberá utilizar una ecuación logarítmica. ^ 


Año 

Ventas (millones 
de dólares) 

Año 

Ventas (millones 
de dólares) 

2000 

8.0 

2006 

39.4 

2001 

10.4 

2007 

50.5 

2002 

13.5 

2008 

65.0 

2003 

17.6 

2009 

84.1 

2004 

22.8 

2010 

109.0 

2005 

29.3 




a) Determine la ecuación logarítmica. 

b) Determine las coordenadas de los puntos de la recta logarítmica de 1997 y 2006. 

c) ¿Cuál es el aumento porcentual anual de las ventas, en promedio, durante el periodo de 2000 
a 2008? 

d) Con base en la ecuación, ¿cuáles son las ventas estimadas para 2009? 

24 . Las siguientes son las cantidades que gasta en publicidad (millones de dólares) una empresa gran- 
de de 2000 a 2010. 


Año 

Cantidad 

Año 

Cantidad 

2000 

88.1 

2006 

132.6 

2001 

94.7 

2007 

141.9 

2002 

102.1 

2008 

150.9 

2003 

109.8 

2009 

157.9 

2004 

118.1 

2010 

162.6 

2005 

125.6 




a) Determine la ecuación de la tendencia logarítmica, 
ib) Estime los gastos en publicidad en 2013. 

c) ¿Cuál es el aumento porcentual anual del gasto en publicidad durante el periodo? 

25 . Los siguientes son los precios de venta de las acciones de Oracle, Inc., al cierre de año. m 


Año 

Precio 

Año 

Precio 

Año 

Precio 

Año 

Precio 

1990 

0.1944 

1995 

3.1389 

2000 

29.0625 

2005 

12.21 

1991 

0.3580 

1996 

4.6388 

2001 

13.81 

2006 

19.11 

1992 

0.7006 

1997 

3.7188 

2002 

10.80 

2007 

20.23 

1993 

1.4197 

1998 

7.1875 

2003 

13.23 

2008 

17.73 

1994 

2.1790 

1999 

28.0156 

2004 

13.72 

2009 

24.53 
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a) Trace los datos. 

£>) Determine la ecuación de la tendencia de mínimos cuadrados. Utilice el precio accionario actual 
y el logaritmo del precio. ¿Cuál parece producir una proyección más precisa? 

c) Calcule los puntos de los años de 1993 y 1998. 

d) Estime el precio de venta en 2012. ¿Parece una estimación razonable con base en los datos 
históricos? 

e) ¿Cuánto aumentó o disminuyó el precio accionario (por año), en promedio, durante el periodo? 
Utilice su mejor respuesta del inciso b). 

26. La producción de Reliable Manufacturing Company de 2009 y parte de 2010 es la siguiente. 


Mes 

Producción 
en 2009 
(miles) 

Producción 
en 2010 
(miles) 

Enero 

6 

7 

Febrero 

7 

9 

Marzo 

12 

14 

Abril 

8 

9 

Mayo 

4 

5 

Junio 

3 

4 


Mes 

Producción 
en 2009 
(miles) 

Producción 
en 2010 
(miles) 

Julio 

3 

4 

Agosto 

5 


Septiembre 

14 


Octubre 

6 


Noviembre 

7 


Diciembre 

6 



a) Con el método de razón con el promedio móvil, determine los índices específicos estacionales 
de julio, agosto y septiembre de 2009. 

b) Suponga que los índices específicos estacionales de la siguiente tabla son correctos. Inserte 
en la tabla los índices específicos estacionales que calculó en el inciso a) de julio, agosto y sep- 
tiembre de 2009, y determine los 12 índices estacionales habituales. 


Año 

Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Dic 

2009 







? 

? 

? 

92.1 

106.5 

92.9 

2010 

88.9 

102.9 

178.9 

118.2 

60.1 

43.1 

44.0 

74.0 

200.9 

90.0 

101.9 

90.9 

2011 

87.6 

103.7 

170.2 

125.9 

59.4 

48.6 

44.2 

77.2 

196.5 

89.6 

113.2 

80.6 

2012 

79.8 

105.6 

165.8 

124.7 

62.1 

41 .7 

48.2 

72.1 

203.6 

80.2 

103.0 

94.2 

2013 

89.0 

112.1 

182.9 

115.1 

57.6 

56.9 








c) Interprete el índice estacional habitual. 

27. Las ventas de Andre’s Boutique en 2009 y parte de 2010 son: 


Mes 

Ventas en 
2009 (miles) 

Ventas en 
2010 (miles) 

Mes 

Ventas en 
2009 (miles) 

Ventas en 
2010 (miles) 

Enero 

78 

65 

Julio 

81 

65 

Febrero 

72 

60 

Agosto 

85 

61 

Marzo 

80 

72 

Septiembre 

90 

75 

Abril 

110 

97 

Octubre 

98 


Mayo 

92 

86 

Noviembre 

115 


Junio 

86 

72 

Diciembre 

130 



a) Con el método de la razón con promedio móvil, determine los índices estacionales específicos 
de julio, agosto, septiembre y octubre de 2009. 

b) Suponga que los índices estacionales específicos de la siguiente tabla son correctos. Inserte 
en la tabla los índices estacionales específicos que calculó en el inciso a) de julio, agosto, sep- 
tiembre y octubre de 2009, y determine los 12 índices estacionales habituales. 


Año 

Ene 

Feb 

Mar 

Abr 

May 

Jun 

Jul 

Ago 

Sep 

Oct 

Nov 

Dic 

2009 

2010 

83.9 

77.6 

86.1 

118.7 

99.7 

92.0 

? 

87.0 

? 

91.4 

? 

97.3 

? 

105.4 

123.6 

124.9 

150.9 

140.1 

2011 

86.7 

72.9 

86.2 

121.3 

96.6 

92.0 

85.5 

93.6 

98.2 

103.2 

126.1 

141.7 

2012 

85.6 

65.8 

89.2 

125.6 

99.6 

94.4 

88.9 

90.2 

100.2 

102.7 

121.6 

139.6 

2013 

77.3 

81.2 

85.8 

115.7 

100.3 

89.7 








c) Interprete el índice estacional habitual. 
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28 . La producción trimestral de madera de pino, en millones de pies-tabla, de Northwest Lumber 
desde 2006 es: 


Año 


Trimestre 


Invierno 

Primavera 

Verano 

Otoño 

2006 

7.8 

10.2 

14.7 

9.3 

2007 

6.9 

11.6 

17.5 

9.3 

2008 

8.9 

9.7 

15.3 

10.1 

2009 

10.7 

12.4 

16.8 

10.7 

2010 

9.2 

13.6 

17.1 

10.3 


a) Determine el patrón estacional habitual de los datos de la producción con el método de razón 
con promedio móvil. 

b) Interprete el patrón. 

c) Desestacionalice los datos y determine la ecuación de la tendencia lineal. 

d) Proyecte la producción estacionalmente ajustada de los cuatro trimestres de 201 1 . 

29. Work Gloves Corp., estudia sus ventas trimestrales de Toughie, el tipo de guantes más durables 
que produce. Los números de pares producidos (en miles) por trimestre son: 


Año 


Trimestre 


Ene-Mar 

II 

Abr-Jun 

III 

Jul-Sep 

IV 

Oct-Dic 

2005 

142 

312 

488 

208 

2006 

146 

318 

512 

212 

2007 

160 

330 

602 

187 

2008 

158 

338 

572 

176 

2009 

162 

380 

563 

200 

2010 

162 

362 

587 

205 


a) Con el método de la razón con promedio móvil, determine los cuatro índices trimestrales habi- 
tuales. 

b) Interprete el patrón estacional habitual. 

30 . Las ventas de material para techos, por trimestre, desde 2004 de Carolina Home Construction, 
Inc., aparecen en la siguiente tabla (en miles de dólares). m 


Año 


Trimestre 


1 

II 

III 

IV 

2004 

210 

180 

60 

246 

2005 

214 

216 

82 

230 

2006 

246 

228 

91 

280 

2007 

258 

250 

113 

298 

2008 

279 

267 

116 

304 

2009 

302 

290 

114 

310 

2010 

321 

291 

120 

320 


a) Determine los patrones estacionales habituales de las ventas con el método de la razón con 
promedio móvil. 

ib) Desestacionalice los datos y determine la ecuación de la tendencia, 

c) Proyecte las ventas de 201 1 y luego ajuste estacionalmente cada trimestre. 

31 . Blueberry Farms Golf and Fish Club de Hilton Head, Carolina del Sur, quiere encontrar los índices 
estacionales mensuales del juego en paquete, juego sin paquete y juego total. El juego en paque- 
te se refiere a los golfistas que visitan el área como parte de un paquete para jugar golf. En gene- 
ral, éste incluye las tarifas del green, del carrito, del alojamiento, del servicio al cuarto y de los 
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alimentos. El campo gana un porcentaje de este total. El juego sin paquete incluye el juego de los 
residentes locales y visitantes en el área que deseen hacerlo. Los siguientes datos comienzan en 
julio de 2007 y reportan los juegos en paquete y sin paquete por mes, así como la cantidad total, 
en miles de dólares. Sffí 


Año 

Mes 

Paquete 

Local 

Total 

Año 

Mes 

Paquete 

Local 

Total 

2007 

Julio 

$ 18.36 

$43.44 

$ 61.80 

2009 

Enero 

30.60 

9.48 

40.08 


Agosto 

28.62 

56.76 

85.38 


Febrero 

63.54 

30.96 

94.50 


Septiembre 

101.34 

34.44 

135.78 


Marzo 

167.67 

47.64 

215.31 


Octubre 

182.70 

38.40 

221.10 


Abril 

299.97 

59.40 

359.37 


Noviembre 

54.72 

44.88 

99.60 


Mayo 

173.61 

40.56 

214.17 


Diciembre 

36.36 

12.24 

48.60 


Junio 

64.98 

63.96 

128.94 

2008 

Enero 

25.20 

9.36 

34.56 


Julio 

25.56 

67.20 

92.76 


Febrero 

67.50 

25.80 

93.30 


Agosto 

31.14 

52.20 

83.34 


Marzo 

179.37 

34.44 

213.81 


Septiembre 

81.09 

37.44 

118.53 


Abril 

267.66 

34.32 

301.98 


Octubre 

213.66 

62.52 

276.18 


Mayo 

179.73 

40.80 

220.53 


Noviembre 

96.30 

35.04 

131.34 


Junio 

63.18 

40.80 

103.98 


Diciembre 

16.20 

33.24 

49.44 


Julio 

16.20 

77.88 

94.08 

2010 

Enero 

26.46 

15.96 

42.42 


Agosto 

23.04 

76.20 

99.24 


Febrero 

72.27 

35.28 

107.55 


Septiembre 

102.33 

42.96 

145.29 


Marzo 

131.67 

46.44 

178.11 


Octubre 

224.37 

51.36 

275.73 


Abril 

293.40 

67.56 

360.96 


Noviembre 

65.16 

25.56 

90.72 


Mayo 

158.94 

59.40 

218.34 


Diciembre 

22.14 

15.96 

38.10 


Junio 

79.38 

60.60 

139.98 


Con software estadístico: 

a) Determine el índice estacional de cada mes de las ventas de los paquetes. ¿Qué observa en el 
transcurso de los meses? 

b) Desarrolle un índice estacional de cada mes de las ventas sin paquete. ¿Qué observa en el 
transcurso de los meses? 

c) Elabore un índice estacional de cada mes de las ventas totales. ¿Qué observa en el transcurso 
de los meses? 

d) Compare los índices de las ventas de paquetes, ventas sin paquete y ventas totales. ¿Son igua- 
les los meses más ocupados? 

32. En la siguiente tabla aparecen los números de jubilados que reciben beneficios del State Teachers 

Retirement System de Ohio de 1991 a 2009. 


Año 

Servicio 

Año 

Servicio 

Año 

Servicio 

Año 

Servicio 

1991 

58 436 

1996 

70 448 

2001 

83 918 

2006 

99 248 

1992 

59 994 

1997 

72 601 

2002 

86 666 

2007 

102 771 

1993 

61 515 

1998 

75 482 

2003 

89 257 

2008 

106 099 

1994 

63 182 

1999 

78 341 

2004 

92 574 

2009 

109 031 

1995 

67 989 

2000 

81 111 

2005 

95 843 




a) Trace los datos. 

b) Determine la ecuación de tendencia de mínimos cuadrados. Utilice una ecuación lineal. 

c) Calcule los puntos de 1993 y 1998. 

d) Estime el número de jubilados que recibirán beneficios en 2012. ¿Parece razonable la estima- 
ción con base en los datos históricos? 

e) ¿Cuánto aumentó o disminuyó el número de jubilados (por año), en promedio, durante el perio- 
do? 

33. Ray Anderson, el propietario de Anderson Ski Lodge, firma que opera en el norte de Nueva York, 
tiene interés en proyectar el número de visitantes del próximo año. Dispone de los siguientes 
datos, por trimestre, desde 2004. Elabore el índice estacional de cada trimestre. ¿Cuántos visitan- 
tes esperaría en cada trimestre de 2010, si Ray proyecta que en 2011 el número total de visi- 
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tantes aumentará 10%? Determine la ecuación de tendencia, proyecte el número de visitantes de 
201 1 y ajuste estacionalmente la proyección. ¿Qué proyección elegiría? 


Año 

Trimestre 

Visitantes 

Año 

Trimestre 

Visitantes 

2004 

1 

86 

2008 

1 

188 


II 

62 


II 

172 


III 

28 


III 

128 


IV 

94 


IV 

198 

2005 

1 

106 

2009 

1 

208 


II 

82 


II 

202 


III 

48 


III 

154 


IV 

114 


IV 

220 

2006 

1 

140 

2010 

1 

246 


II 

120 


II 

240 


III 

82 


III 

190 


IV 

154 


IV 

252 

2007 

1 

162 





II 

140 





III 

100 





IV 

174 





34 . Las inscripciones en la facultad de administración de Midwestern University por trimestre desde 
2006 son: 


Año 


Trimestre 

Otoño 

Invierno 

Primavera 

Verano 

2006 

2 033 

1 871 

714 

2 318 

2007 

2 174 

2 069 

840 

2 413 

2008 

2 370 

2 254 

927 

2 704 

2009 

2 625 

2 478 

1 136 

3 001 

2010 

2 803 

2 668 

— 

— 


Con el método de la razón con promedio móvil: 

a) Determine los cuatro índices trimestrales. 

b) Interprete el patrón trimestral de las inscripciones. ¿Le sorprende la variación estacional? 

c) Calcule la ecuación de tendencia y proyecte las inscripciones para 201 1 por trimestre. 

35 . El Jamie Farr Kroger Classic es un torneo LPGA (golf profesional femenil) que se juega cada año 
en Toledo, Ohio. En la siguiente tabla aparece la bolsa total y el premio para el ganador durante 
los 22 años de 1988 a 2009. Desarrolle la ecuación de tendencia de las dos variables. ¿Qué varia- 
ble aumenta más rápido? Proyecte la cantidad de la bolsa y del premio para la ganadora en 201 1 . 
Encuentre la razón del premio de la ganadora a la bolsa total. ¿Qué encontró? ¿Qué variable esti- 
ma con más precisión: el tamaño de la bolsa o el premio de la ganadora? 


Año 

Bolsa 

Premio 

Año 

Bolsa 

Premio 

1988 

$275 000 

$ 41 250 

1999 

$ 800 000 

$120 000 

1989 

275 000 

41 250 

2000 

1 000 000 

150 000 

1990 

325 000 

48 750 

2001 

1 000 000 

150 000 

1991 

350 000 

52 500 

2002 

1 000 000 

150 000 

1992 

400 000 

60 000 

2003 

1 000 000 

150 000 

1993 

450 000 

67 500 

2004 

1 200 000 

180 000 

1994 

500 000 

75 000 

2005 

1 200 000 

180 000 

1995 

500 000 

75 000 

2006 

1 200 000 

180 000 

1996 

575 000 

86 250 

2007 

1 300 000 

195 000 

1997 

700 000 

105 000 

2008 

1 300 000 

195 000 

1998 

800 000 

120 000 

2009 

1 400 000 

210 000 


Comandos de software 
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36. Visite el sitio del Bureau of Labor Statistics en www.bls.gov y haga clic en la opción Consumer 
Price Index, seleccione Consumer Price Index— All Urban Consumere (Current Series), luego 
U.S. All ítems, 1982-1984 = 100 y haga clic en Retrieve data, en la parte inferior. Pida el resulta- 
do anual de los últimos 10 o 20 años. Elabore la ecuación de regresión del índice de Precios al 
Consumidor anual durante el periodo seleccionado. Utilice el enfoque lineal y el logarítmico. ¿Cuál 
considera mejor? 

37. Desarrolle la recta de tendencia de los últimos 10 años de una compañía grande o bien conocida, 
como GM, General Electric o Microsoft. Visite el sitio web de la compañía. La mayoría de las 
empresas tienen una sección denominada “Financial Information” o alguna similar. En esa ubica- 
ción busque las ventas durante los últimos 1 0 años. Si no conoce el sitio web de la compañía, vaya 
a la sección financiera de Yahoo! o USA Today, donde hay una ubicación para “symbol lookup”. 
Escriba el nombre de la compañía, lo que le dará el símbolo. Busque la compañía por medio de su 
símbolo y deberá encontrar la información. El símbolo de GM es sólo GM, y el de General Electric 
es GE. Haga un comentario sobre la recta de tendencia de la compañía que seleccionó durante el 
periodo. ¿Aumenta o disminuye la tendencia? La recta de tendencia, ¿sigue una ecuación lineal o 
logarítmica? 

38. Seleccione uno de los indicadores económicos más importantes, como el Promedio Industrial Dow 
Jones, Nasdaq o el S&P 500. Desarrolle la recta de tendencia del índice durante los últimos años, 
con el valor del índice al cierre de año o de los últimos 30 días seleccionando el valor de cierre del 
índice de los últimos 30 días. Puede ubicar esta información en muchos lugares. Por ejemplo, visi- 
te http://finance.yahoo.com, haga clic en Nasdaq a la izquierda, seleccione Historical Prices y un 
periodo, tal vez los últimos 30 días, y encontrará la información. Haga un comentario sobre la recta 
de la tendencia que elaboró. La recta de la tendencia, ¿aumenta o disminuye? ¿Sigue una ecua- 
ción lineal o logarítmica? 


Ejercicios de lo base de datos 

39. Consulte los datos Baseball 2009, con información respecto de la temporada de la Liga Mayor de 
Béisbol 2009. Los datos incluyen el salario medio de los jugadores desde 1989. Trace la informa- 
ción y elabore una ecuación de tendencia lineal. Escriba un reporte breve de sus averiguaciones. 


Comandos de software 

1. Los comandos en MegaStat para elaborar los índices esta- 
cionales de las páginas 625 y 626 son: 

a) Escriba el periodo codificado y el valor de la serie de 
tiempo en dos columnas. Quizá también desee incluir 
información sobre los años y trimestres. 

b) Seleccione MegaStat, Time/Forecasting y Deseaso- 
nalization, y oprima Enter. 

c) Escriba el rango de los datos, indique que los datos son 
del primer trimestre y haga clic en OK. 
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Capítulo 16 Respuestas a las autoevaluaciones 





Total móvil 

Promedio 


Producción 

de tres 

móvil de 

Año 

(miles) 

años 

tres años 

2005 

2 

— 


2006 

6 

12 

4 

2007 

4 

15 

5 

2008 

5 

12 

4 

2009 

3 

18 

6 

2010 

10 

— 


12 







co 

CD 

Datos originales 


É 9 

_ Promedio móvil 


O 

"O 

O 

■S 6 




cL 

° 3 

CD J 

E 

=3 

Ao 

<x 


z 0 

i i 

1 1 L 


2005 2006 2007 

2008 2009 2010 


16-2 a) 



1 2 3 4 5 6 7 8 Códigos 

b) Y = a + bt = 3.3928 + 1 ,1905f (en miles) 

c) En 2002: 


Y= 3.3928 + 1.1905(1) = 4.5833 
en 2009: 

Y= 3.3928 + 1.1905(8) = 12.9168 
d ) En 201 2, f = 1 1 , así que 

Y= 3.3928 + 1.1905(11) = 16.4883 


Año 

Y 

log Y 

t 

2006 

2.13 

0.3284 

1 

2007 

18.10 

1.2577 

2 

2008 

39.80 

1.5999 

3 

2009 

81.40 

1.9106 

4 

2010 

112.00 

2.0492 

5 


b = 0.40945 


a = 0.20081 


b) Casi 156.7%. El antilogaritmo de 0.40945 es 2.567. Al 
restar 1 se obtiene 1 .567. 

c) Casi 454.5, determinado por Y = 0.20081 + 

.40945(6) = 2.65751. El antilogaritmo de 2.65751 es 
454.5. 

16-4 a) Los siguientes valores son de un paquete de software. 
Debido al redondeo, sus cifras pueden diferir un poco. 



Invierno 

Primavera 

Verano 

Otoño 

Media 

Estacional 

119.35 

81.66 

125.31 

74.24 

habitual 

119.18 

81.55 

125.13 

74.13 


El factor de corrección es 0.9986. 
b) Las ventas totales en Tetón Village para la temporada 
de invierno en general están 19.18% arriba del prome- 
dio anual. 

16-5 El valor proyectado para enero del sexto año es 34.9, 
determinado por: 

Y = 4.4 + 0.5(61) = 34.9 

Al ajustar estacionalmente la proyección, 34.9(1 20)/1 00 = 
41 .88. Para febrero, / = 4.4 + 0.5(62) = 35.4. Así, 
(35.4)(95)/1 00 = 33.63. 


o 16 488 mecedoras. 



Repaso de los capítulos 15 y 16 
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Repaso de los capítulos 15 y 16 


En el capítulo 15 se presentan los números índices. Un número índice describe el cambio relativo de 
valor de un periodo, denominado periodo base, a otro denominado periodo dado. En realidad es un 
porcentaje, pero, en general, el signo de porcentaje se omite. Los índices se utilizan para comparar el 
cambio en series desiguales en el tiempo. Por ejemplo, una compañía podría querer comparar el cam- 
bio en las ventas con el cambio en el número de vendedores empleados durante el mismo periodo. Una 
comparación directa no es significativa porque las unidades de un conjunto de datos son dólares, y del 
otro, personas. Los números índice también facilitan la comparación de valores muy grandes, donde la 
cantidad de cambio en los valores actuales es muy grande y, por lo tanto, difíciles de interpretar. 

Hay dos tipos de índices de precios. Un índice de precios no ponderado no considera las cantida- 
des. Para formar un índice no ponderado se divide el valor del periodo base entre el periodo actual 
(también denominado periodo dado) y se reporta el cambio porcentual. Por lo tanto, sí las ventas fue- 
ron de $12 000 000 en 2004 y de $18 600 000 en 2010, el índice de precios sin ponderar simple de 
2010 es: 


P = 


— ( 100 ) 
P o 


$18 600 000 
$12 000 000 


(100) = 155.0 


Se concluye que las ventas aumentaron 55% durante el periodo de seis años. 

Un índice de precios ponderado considera las cantidades. El índice ponderado más común es el 
índice de precios de Laspeyres. En él se utilizan las cantidades del periodo base como ponderaciones 
para comparar cambios de precios. Se calcula al multiplicar las cantidades del periodo base por el pre- 
cio del periodo base por cada producto considerado, y se suma el total. Este resultado es el denomi- 
nador de la fracción. El numerador de la fracción es el producto de las cantidades del periodo base por 
el precio actual. Por ejemplo, una tienda de aparatos electrónicos vendió 50 computadoras a $1 000 y 
200 reproductores de DVD a $150 cada uno en el año 2004. En 2010, la misma tienda vendió 60 com- 
putadoras a $1 200 y 230 reproductores de DVD a $175. El índice de precios de Laspeyres es: 


p = ( 100 ) 
-Po<7o 


$1 200 X 50 + $175 X 200 
$1 000 X 50 + $150 X 200 (1 ' 


$95 000 
$80 000 


( 100 ) 


118.75 


Observe que se utilizan las mismas cantidades del periodo base como ponderaciones tanto en el 
numerador como en el denominador. El índice indica 1 8.75% de aumento del valor de las ventas duran- 
te el periodo de seis años. 

El índice de uso y reporte más frecuente es el índice de Precios al Consumidor (IPC). El IPC es un 
índice del tipo de Laspeyres. Lo elabora cada mes el U.S. Department of Labor para reportar la tasa de 
inflación de los precios de bienes y servicios en Estados Unidos. El periodo base actual es 1982-1984. 

En el capítulo 16 se estudiaron las series de tiempo y los pronósticos (proyección). Una serie de 
tiempo es un conjunto de datos durante un periodo. Las ganancias por acción de las acciones comu- 
nes de General Electric durante los últimos diez años es un ejemplo de una serie de tiempo. Una serie 
de tiempo consta de cuatro componentes: de tendencia, efectos cíclicos, efectos estacionales y efec- 
tos irregulares. 

La tendencia es la dirección de largo plazo de la serie de tiempo. Puede aumentar o disminuir. 

El componente cíclico es la fluctuación por arriba y por debajo de la recta de tendencia durante 
un periodo de varios años. Los ciclos económicos son ejemplos del componente cíclico. La mayoría de 
los negocios cambian entre periodos de expansión relativa y reducción durante un ciclo de varios años. 

La variación estacional es el patrón recurrente de la serie de tiempo en un año. El consumo de 
muchos productos y servicios es por temporadas. Las casas de playa a lo largo de la Costa del Golfo 
casi no se rentan durante el invierno, y los albergues de ski en Wyoming no se utilizan en los meses de 
verano. De aquí que la renta de propiedades frente a la playa y los albergues de ski sean estacionales. 

El componente irregular incluye cualesquiera eventos impredecibles. En otras palabras, incluye 
eventos que no se pueden prever. Hay dos tipos de componentes irregulares. Las variaciones episódi- 
cas son impredecibles, pero en general se pueden identificar. La inundación de Nashville en el verano 
de 2010 es un ejemplo. La variación residual es de naturaleza aleatoria y no se puede predecir ni iden- 
tificar. 

La tendencia lineal de una serie de tiempo se obtiene por medio de la ecuación Y = a + bt, donde 
Y es el valor estimado de la tendencia, a es la intersección con el eje Y, b es la pendiente de la recta 
de tendencia (la tasa de cambio) y t se refiere a los valores codificados de los periodos. El método de 
mínimos cuadrados descrito en el capítulo 13 se emplea para determinar la recta de la tendencia. Con 
frecuencia, la autocorrelación es un problema cuando se utiliza la ecuación de tendencia. 
Autocorrelación significa que los valores sucesivos de la serie de tiempo están correlacionados. 
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Glosario 


Capítulo 15 

índice de Precios al Consumidor índice reportado mensual- 
mente por el U.S. Department of Labor. Describe el cambio de 
precios de una canasta básica de bienes y servicios del periodo 
base 1982-1984 al presente. 

índice simple Valor en el periodo dado dividido entre el valor 
en el periodo base. En general, el resultado se multiplica por 100 
y se reporta como porcentaje. 

índice ponderado Los precios en el periodo base y el periodo 
dado se multiplican por cantidades (ponderaciones). 

Capítulo 16 

Autocorrelación Los residuos sucesivos en una serie de tiem- 
po están correlacionados. 


Variación cíclica Aumento y disminución de una serie de tiem- 
po durante periodos mayores de un año. 

Variación episódica Variación de naturaleza aleatoria, pero 
que se puede identificar. 

Variación irregular Variación de naturaleza aleatoria que se 
observa en una serie de tiempo y que no se repite regularmente. 
Variación residual Variación de naturaleza aleatoria que no se 
puede identificar ni predecir. 

Variación estacional Patrones de cambio en una serie de tiem- 
po en un año. Estos patrones de cambio se repiten cada año. 
Tendencia secular Dirección de largo plazo suavizada de una 
serie de tiempo. 


Problemas 


1. En la siguiente tabla aparece el ingreso consolidado (miles de millones de dólares) de General 
Electric de 2005 a 2009. 


Año 

Ingresos consolidados 
(miles de millones de dólares) 

2005 

148 

2006 

151 

2007 

172 

2008 

182 

2009 

157 


a) Determine el índice de 2009, con 2005 como periodo base. 

b) Utilice el periodo 2005 a 2007 como periodo base y encuentre el índice de 2009. 

c) Con 2005 como año base, utilice el método de mínimos cuadrados para encontrar la ecuación 
de tendencia. ¿Cuál es ei ingreso consolidado estimado para 2012? ¿Cuál es la tasa de incre- 
mento por año? 

2. En la siguiente tabla aparece la tasa de desempleo y la fuerza laboral disponible en tres condados 
en el noroeste de Pennsylvania en junio de 2007 y mayo de 2010. 


Condado 

Junio 2007 

Mayo 2010 

Fuerza 

laboral 

Desempleo 

% 

Fuerza 

laboral 

Desempleo 

% 

Erie 

141 500 

4.8 

141 800 

10.0 

Warren 

22 700 

4.7 

21 300 

8.5 

McKean 

22 200 

4.9 

21 900 

10.8 


a) En junio de 2007, en Estados Unidos el índice nacional de desempleo fue de 4.6%. Calcule, 
para junio de 2007, un índice simple del promedio de desempleo de la región, utilizando el índi- 
ce nacional de desempleo como base. Interprete el índice simple promedio. 

b) En mayo de 2010, el índice nacional de desempleo de Estados Unidos fue de 9.7%. Calcule, 
para mayo de 2010, el índice simple del promedio de desempleo de la región, utilizando el índi- 
ce nacional de desempleo como base. Interprete el índice simple promedio. 

c) Utilice los datos de esta región del noroeste de Pennsylvania para elaborar un índice pondera- 
do de desempleo con el método de Laspeyres. Emplee los datos de junio de 2007 como perio- 
do base. Interprete el índice. 

3. Con base en cinco años de datos mensuales (de enero de 2006 a diciembre de 2010), la ecuación 
de tendencia de una compañía pequeña es Y = 3.5 + 0.7f. El índice estacional de enero es 120, 
y de junio, 90. ¿Cuál es la proyección de las ventas ajustadas por temporada de enero de 201 1 y 
junio de 2011? 


Test de práctica 
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Test de práctica 

Parte 1 : Objetivo 

1. Para calcular un índice, el periodo base es el (numerador, denominador, cualquiera de los dos, siempre 100). 

1 

2. Un número que mide el cambio relativo de un periodo a otro se denomina 

2 

3. Un índice ponderado considera tanto el precio como . 3 

4. Un índice de Laspeyres utiliza cantidades tanto en el numerador como en el denominador (elija una: periodo base, pe- 
riodo dado, las más antiguas, las más recientes). 4 

5. El periodo base actual del índice de Precios al Consumidor es 5. 

6. La dirección a largo plazo de una serie de tiempo se denomina 6 

7. Uno de los métodos que se usan para suavizar la tendencia en una serie de tiempo es 7. 

8. Cuando residuos sucesivos están correlacionados, la condición se denomina 8 

9. La variación irregular en una serie de tiempo, que es de naturaleza aleatoria, se denomina 9 

10. En un promedio móvil de tres años, las ponderaciones dadas a cada periodo son (las mismas, el año más lejano tiene 

más peso, el año más lejano tiene el menor peso). 10 

Parte 2: Problemas 

1. A continuación se reportan las ventas de Roberta’s Ice Cream Stand de los últimos cinco años. 


Año 

Ventas 

2006 

$130 000 

2007 

145 000 

2008 

120 000 

2009 

170 000 

2010 

190 000 


a) Calcule el índice simple de cada año, usando 2006 como año base. 

b) Calcule el índice simple de cada año, usando 2006-2007 como año base. 

2. A continuación se muestran el precio y la cantidad de diversos artículos para golf comprados por miembros de la liga varonil de 
golf en Indigo Creek Golf y en el Tennis Club. 



2006 

2010 

Precio 

Cantidad 

Precio 

Cantidad 

Driver 

$250.00 

5 

$275.00 

6 

Putter 

60.00 

12 

75.00 

10 

Irons 

700.00 

3 

750.00 

4 


a) Determine el índice simple agregado del precio, con 2006 como periodo base. 

b) Determine el índice Laspeyres del precio. 

c) Determine el índice de Paasche del precio. 

d) Determine un índice de valor. 

3. La ecuación lineal de tendencia mensual de la Hoopes ABC Beverage Store es: 

Y = 5.50 + 1.25Í 

La ecuación se basa en cuatro años de datos mensuales, y se reporta en miles de dólares. El índice de enero es 1 05.0 y de febre- 
ro, 98.3. Determine la proyección estacionalmente ajustada de enero y febrero en el quinto año. 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Métodos no 
paramétricos: 


0A1 Realizar una prueba de 
hipótesis para comparar un 
conjunto observado de 
frecuencias con una 
distribución esperada. 

0A2 Enumerar y explicar las 
características de la 
distribución //'cuadrada. 

0A3 Realizar una prueba de 
precisión bondad de ajuste 
para frecuencias desiguales 
esperadas. 

0A4 Realizar una prueba de 
hipótesis para verificar que los 
datos agrupados en una 
distribución de frecuencia son 
una muestra de una población 
normal. 

0A5 Utilizar los métodos 
gráficos y estadísticos para 
determinar si un grupo de 
datos muéstrales proviene de 
una población normal. 

0A6 Realizar la prueba de ji 
cuadrada de la Independencia 
en una tabla de contingencia. 


pruebas de bondad de ajuste 



Durante muchos años, los ejecutivos de televisión dieron crédito a la 
pauta de que 30% de la audiencia veía cada una de las cadenas 
televisivas de mayor audiencia, y 1 0%, canales de televisión por cable 
durante una noche a la semana. Una muestra aleatoria de 500 
televidentes del área de Tampa-St. Petersburg, Florida, el pasado lunes 
por la noche, reveló que 165 hogares sintonizaron ABC, 140, CBS, 125, 
NBC, y el resto vio un canal de televisión por cable. Con un nivel de 
significancia de .05, ¿es posible concluir que la pauta aún es 
razonable? (Vea ejercicio 12, objetivo 2.) 



17.2 Prueba de bondad de ajuste: frecuencias esperadas iguales 
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OA1 Realizar una prueba de 
hipótesis para comparar un 
conjunto observado de 
frecuencias con una 
distribución esperada. 


Cjemplo 




Solución 


17.1 Introducción 

En los capítulos 9 a 12 se analizaron datos a escala de intervalo o de razón, como los pesos 
de lingotes de acero, Ingresos de minorías y años de empleo. Se realizaron pruebas de hipó- 
tesis respecto de una sola media de población, dos medias y tres o más medias. Para efec- 
tuar estas pruebas se supuso que las poblaciones siguen la distribución de probabilidad 
normal. Sin embargo, hay algunas en las cuales no es necesaria una suposición respecto de 
la forma de la población. A estas pruebas se les conoce como no paramétricas. Esto significa 
que no es necesario suponer que existe una población normal. 

También hay pruebas exclusivas para datos a escala de medición nominal. Recuerde del 
capítulo 1 que los datos nominales son los “más bajos” o más primitivos. En este tipo de medi- 
ción, los datos se clasifican en categorías donde no hay un orden natural, como el género de 
los representantes del Congreso, el estado donde nacieron los estudiantes o la marca de man- 
tequilla de maní que compró. En este capítulo aparece un nuevo estadístico de prueba, el esta- 
dístico // cuadrada. 

17.2 Prueba de bondad de ajuste: 
frecuencias esperadas iguales 

La prueba de bondad de ajuste es una de las pruebas estadísticas de uso más común. Es par- 
ticularmente útil porque requiere sólo un nivel nominal de medición. Por ello es posible llevar 
a cabo una prueba de hipótesis con datos que han sido clasificados en grupos. La primera 
ilustración de esta prueba supone el caso en que las frecuencias esperadas de las celdas son 
¡guales. Como su nombre lo indica, el propósito de la prueba de bondad de ajuste es compa- 
rar una distribución observada con una distribución esperada. Un ejemplo describirá la situa- 
ción de una prueba de hipótesis. 


Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del 
Golfo de Florida. Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo, deci- 
de contratar a Magnolia Research, LLC, para que lleve a cabo una encuesta entre personas 
adultas para saber cuál es su platillo favorito cuando comen fuera de casa. Magnolia seleccio- 
nó una muestra de 120 adultos y les pidió que indicaran su comida favorita cuando salen a 
cenar. Los resultados se reportan en la siguiente tabla. 


TABLA 17-1 Plato fuerte seleccionado por una muestra de 120 adultos 



¿Es razonable concluir que no hay preferencia entre los cuatro platillos? 

Si no existe diferencia entre la popularidad de los cuatro platillos, se podría esperar que las fre- 
cuencias observadas fueran iguales, o casi iguales. Para decirlo de otro modo, se esperaría 
que el mismo número de adultos indicara que prefiere pollo o pescado. Así, cualquier discre- 
pancia entre las frecuencias observadas y esperadas se atribuye al azar, o a un error de mues- 
treo. 

¿Cuál es el nivel de medición en este problema? Observe que cuando se selecciona a una 
persona, sólo se le puede clasificar en una de las categorías de platillos preferidos. No se 
obtiene ningún tipo de lectura o medición. La “medida” o “clasificación” se basa en el platillo 
seleccionado. Además, no existe un orden natural entre los platillos. No se supone que algu- 
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no de los platillos sea mejor que otro. Por lo pronto, la 
escala nominal es apropiada. 

Si los platillos son igualmente populares, se espera- 
ría que 30 adultos eligieran cada uno de ellos. ¿Por qué 
es esto? Si hay 120 adultos en la muestra, y cuatro cate- 
gorías, lo esperado sería que una cuarta parte de los 
encuestados elegirían cada platillo. Por lo tanto, la fre- 
cuencia esperada de cada categoría o celda sería 30, 
calculada mediante 120/4, asumiendo que no existe pre- 
ferencia por ninguno de los platillos. Esta información se 
resume en la tabla 17-2. Un examen de los datos indica 
que la carne es el platillo seleccionado con más frecuen- 
cia (35 de 120), y que el pescado es el que cuenta con 
menos preferencia (24 de 120). ¿Se debe al azar esta 
diferencia entre los números de veces que cada platillo 
es seleccionado, o se debe concluir que los platillos no 
tienen el mismo grado de popularidad? 


TABLA 17-2 Frecuencias observadas y esperadas de la encuesta entre 120 personas adultas 


Plato favorito 

Frecuencia 
observada, f 0 

Frecuencia 
esperada, f e 

Pollo 

32 

30 

Pescado 

24 

30 

Carne 

35 

30 

Pasta 

29 

30 

Total 

120 

120 


Para dilucidar este problema, se utiliza el procedimiento de la prueba de hipótesis en cinco 
pasos. 

Paso 1: Formule las hipótesis nula y alternativa. La hipótesis nula, H 0 , es que no hay 

diferencia entre el conjunto de frecuencias observadas y el conjunto de frecuen- 
cias esperadas. En otras palabras, que cualquier diferencia entre los dos conjun- 
tos de frecuencias se puede atribuir al error de muestreo. La hipótesis alternativa, 
H-i, es que hay una diferencia entre los conjuntos observado y esperado de fre- 
cuencias. Si se rechaza la hipótesis nula y se acepta la hipótesis alternativa, se 
concluye que las preferencias no se distribuyen de igual forma entre las cuatro 
categorías (celdas). 

H 0 -, No hay diferencia entre las proporciones de adultos que eligen cada platillo. 
Hy. Existe diferencia entre las proporciones de adultos que eligen cada platillo. 

Paso 2: Seleccione el nivel de significancia. Seleccione el nivel de significancia 0.05. La 
probabilidad de que rechace la hipótesis nula verdadera es 0.05. 

Paso 3: Seleccione el estadístico de prueba. El estadístico de prueba sigue la distribu- 
ción ji cuadrada, designada como x 2 - 


ESTADISTICO DE PRUEBA JI CUADRADA 


x 2 = 2 



con k - 1 grados de libertad, donde: 
k es el número de categorías. 

f 0 es la frecuencia observada en una categoría particular. 
f e es la frecuencia esperada en una categoría particular. 
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Estadística en acción 

Durante muchos años, 
investigadores y estadísti- 
cos creyeron que todas las 
variables se distribuían 
normalmente. De hecho, 
en general, se suponía una 
ley universal. Sin embar- 
go, Karl Pearson observó 
que los datos experimen- 
tales no siempre se ajusta- 
ban a este supuesto, pero 
no había forma de 
demostrar que sus obser- 
vaciones eran correctas. 
Para resolver este proble- 
ma, Pearson descubrió el 
estadístico ji cuadrada, 
que en esencia compara 
una distribución de la 
frecuencia observada con 
una supuesta distribución 
normal. Su descubri- 
miento demostró que no 
todas las variables tenían 
una distribución normal. 

V 


En breve estudiaremos las características de la distribución ji cuadrada con más 
detalle. 

Paso 4: Formule la regla de decisión. Recuerde que, en las pruebas de hipótesis, la 
regla de decisión requiere determinar un número que separe la región donde no 
se rechaza H 0 de la región de rechazo. Este número se denomina valor crítico. 
Como verá, la distribución ji cuadrada en realidad es una familia de distribucio- 
nes. Cada distribución tiene una forma un poco diferente, según el número de 
grados de libertad. El número de grados de libertad en este tipo de problema se 
encuentra mediante k - 1 , donde k es el número de categorías. En este proble- 
ma en particular hay cuatro. Como hay cuatro categorías, hay k - 1=4-1 = 
3 grados de libertad. Como se observó, una categoría se denomina celda, por lo 
que hay cuatro celdas. El valor crítico para 3 grados de libertad y el nivel de sig- 
nificancia 0.05 se encuentran en el apéndice B.3. Una parte de esa tabla apare- 
ce en la tabla 17-3. El valor crítico es 7.815, determinado al ubicar 3 grados de 
libertad en el margen izquierdo, y luego, por la horizontal (a la derecha), y leyen- 
do el valor crítico en la columna 0.05. 


TABLA 1 7-3 Parte de la tabla de ji cuadrada 


Grados 
de libertad 

gi 


Área de la cola derecha 


.10 

.05 

.02 

.01 

1 

2.706 

3.841 

5.412 

6.635 

2 

4.605 

5.991 

7.824 

9.210 

3 

6.251 

7.815 

9.837 

11.345 

4 

7.779 

9.488 

11.668 

13.277 

5 

9.236 

11.070 

13.388 

15.086 


La regla de decisión es rechazar H 0 si el valor calculado de ji cuadrada 
es mayor que 7.815. Si es menor o igual a 7.815, no se rechaza H 0 . En la gráfica 
17-1 se muestra la regla de decisión. 



GRÁFICA 17-1 


Distribución de probabilidad ji cuadrada para 3 grados de libertad, con la región 
de rechazo y un nivel de significancia de 0.05 


La regla de decisión indica que si hay diferencias grandes entre las frecuen- 
cias observada y esperada, lo que genera una x 2 calculada mayor que 7.815, se 
debe rechazar la hipótesis nula. Sin embargo, si las diferencias entre f 0 y f e son 
pequeñas, el valor x 2 calculado será 7.815 o menor, por lo que la hipótesis nula 
no se debe rechazar. El razonamiento es que es probable que esas pequeñas 
diferencias entre las frecuencias observada y esperada se deban a la casualidad. 
Recuerde que las 120 observaciones son una muestra de la población. 

Paso 5: Calcule el valor de ji cuadrada y tome una decisión. De los 120 adultos que 
integraban la muestra, 32 indicaron que su platillo favorito era el pollo. Los con- 



652 


CAPÍTULO 17 Métodos no paramétrícos: pruebas de bondad de ajuste 


teos se registraron en la tabla 17-1. Los siguientes son los cálculos de la ji cua- 
drada. (Observe una vez más que las frecuencias esperadas son las mismas para 
cada celda.) 

Columna 1 : Determine las diferencias entre cada f 0 y f e . Es decir, f 0 - f e . La suma 
de estas diferencias es cero. 

Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y 
esperada, es decir ( f Q - f e ) z . 

Columna 3: Divida el resultado de cada observación entre la frecuencia espera- 
da. Es decir(f 0 — f e ) 2 /f e . Finalmente, sume estos valores. 

El resultado es el valor de x 2 , que es 2.20. 



La x 2 calculada de 2.20 no está en la región de rechazo, es menor que el valor crí- 
tico de 7.815. Por lo tanto, la decisión es no rechazar la hipótesis nula. Se con- 
cluye que las diferencias entre las frecuencias observada y esperada podrían 
deberse al azar. Esto significa que no hay preferencia entre los cuatro platillos. 

Se puede emplear software para calcular el valor de ji cuadrada. A continuación se presenta la 
captura de pantalla de MegaStat. Los pasos se muestran en la sección Comandos de softwa- 
re, al final del capítulo. El valor calculado de ji cuadrada es 2.20, el mismo valor que se obtu- 
vo en los cálculos anteriores. También observe que el valor p es .5319, mucho mayor que .05. 


Prueba de bondad de ajuste 


% de j i 


Observado 

Esperado 

O - E 

(O - E) 2 /E 

cuadrada 

32 

30 . 000 

2 . 000 

0 . 133 

6 . 06 

24 

30 . 000 

-6 . 000 

1.200 

54 . 55 

35 

30 . 000 

5 . 000 

0.833 

37 . 88 

29 

30 . 000 

- 1.000 

0.033 

1.52 

120 

120 . 000 

0 . 000 

2 .200 

100 . 00 


1 


2.20 ji cuadrada 
3 gl 

5319 valor p 


La distribución ji cuadrada, que se utiliza como el estadístico de prueba en este capítulo, 
tiene las características siguientes. 


OA2 Enumerar y explicar 
las características de la 
distribución y7 cuadrada. 

da para 1 grado de libertad, otra para 2, otra para 3 grados de libertad, etc. En este tipo 
de problema, el número de grados de libertad se determina mediante k — 1, donde k es 
el número de categorías. Por lo tanto, la forma de la distribución ji cuadrada no depende 
del tamaño de la muestra, sino del número de categorías. Por ejemplo, si clasifica a 200 


1 . Los valores de ji cuadrada nunca son negativos. Esta característica se debe a que la 
diferencia entre f a y f e se eleva al cuadrado, es decir ( f Q - f e ) 2 . 

2. Existe una familia de distribuciones de ji cuadrada. Hay una distribución de ji cuadra- 
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empleados de una aerolínea en una de tres categorías: personal de vuelo, apoyo terrestre 
y personal administrativo, tendría /c 1 = 3-1 = 2 grados de libertad. 

3. La distribución ji cuadrada tiene un sesgo positivo. Sin embargo, a medida que aumen- 
ta el número de grados de libertad, la distribución comienza a aproximarse a la distribución 
normal. La gráfica 17-2 muestra las distribuciones de grados de libertad selecciona- 
dos. Observe que, para los 10 grados de libertad, la curva se aproxima a una distribución 
normal. 


La forma de la distribución 
X 2 se aproxima a una distri- 
bución normal conforme gl 
aumenta. 



Valores ji cuadrada (x 2 ) 


GRÁFICA 17-2 Distribuciones ji cuadrada de grados de libertad seleccionados 



La directora de recursos humanos de Georgetown Paper, Inc., está preocupada por el absentismo 
entre los trabajadores por hora, por lo que decide tomar una muestra de los registros de la compa- 
ñía y determinar si el absentismo está distribuido de manera uniforme en toda la semana de seis 
días. Las hipótesis son: 

H 0 : El absentismo está distribuido de manera uniforme en toda la semana de trabajo. 

Hp El absentismo no está distribuido de manera uniforme en toda la semana de trabajo. 

Los resultados de la muestra son: 



Número de ausencias 


Número de ausencias 

Lunes 

12 

Jueves 

10 

Martes 

9 

Viernes 

9 

Miércoles 

11 

Sábado 

9 


a) ¿Cómo se denominan los números 1 2, 9, 1 1 , 1 0, 9 y 9? 

b) ¿Cuántas categorías (celdas) hay? 

c) ¿Cuál es la frecuencia esperada de cada día? 

d) ¿Cuántos grados de libertad hay? 

e) ¿Cuál es el valor crítico de ji cuadrada con un nivel de significancia de 1 %? 

f) Calcule el estadístico de prueba x 2 - 

g) ¿Cuál es su regla de decisión respecto de la hipótesis nula? 

h) Específicamente, ¿qué le indica lo anterior a la directora de recursos humanos? 
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comed; 


Categoría 

fo 

A 

10 

B 

20 

C 

30 


Categoría 

fo 

A 

10 

B 

20 

C 

30 

D 

20 


Ejercicios 

1. En una prueba de bondad de ajuste de ji cuadrada hay cuatro categorías y 200 observaciones. 
Utilice el nivel de significancia 0.05. 

a) ¿Cuántos grados de libertad hay? 

b) ¿Cuál es el valor crítico de ji cuadrada? 

2 . En una prueba de bondad de ajuste de ji cuadrada hay seis categorías y 500 observaciones. Utilice 
el nivel de significancia 0.01. 

a) ¿Cuántos grados de libertad hay? 

b) ¿Cuál es el valor crítico de ji cuadrada? 

3 . Las hipótesis nula y alternativa son: 

H 0 \ Las frecuencias son iguales. 

H-¡: Las frecuencias no son iguales. 

a) Formule la regla de decisión, con el nivel de significancia 0.05. 

b) Calcule el valor de ji cuadrada. 

c) ¿Cuál es su decisión respecto de H 0 1 

4. Las hipótesis nula y alternativa son: 

H 0 : Las frecuencias son iguales. 

Las frecuencia no son iguales. 

a) Formule la regla de decisión, con el nivel de significancia 0.05. 

b ) Calcule el valor de ji cuadrada. 

c) ¿Cuál es su decisión respecto de H 0 ‘7 

5 . Un dado se lanza 30 veces y los números 1 a 6 aparecen como muestra en la siguiente distribu- 
ción de frecuencia. Con un nivel de significancia de 0.10, ¿es posible concluir que el dado no está 
cargado? 


Resultado 

Frecuencia 

Resultado 

Frecuencia 

1 

3 

4 

3 

2 

6 

5 

9 

3 

2 

6 

7 


Día 

Rondas 

Lunes 

124 

Martes 

74 

Miércoles 

104 

Jueves 

98 

Viernes 

120 


6. Classic Golf, Inc., administra cinco cursos de golf en el área de Jacksonville, Florida. El director 
quiere estudiar el número de rondas de golf que se juegan por día en los cinco cursos, por lo que 
reunió la siguiente información de una muestra. Con un nivel de significancia de 0.05, ¿hay una 
diferencia entre el número de rondas jugadas por día de la semana? 

7 . Un grupo de compradoras en tiendas departamentales vio una línea nueva de vestidos y opinó al 
respecto. Los resultaron fueron: 


Opinión 

Número de 
compradoras 

Opinión 

Número de 
compradoras 

Sobresaliente 

47 

Bueno 

39 

Excelente 

45 

Regular 

35 

Muy bueno 

40 

Indeseable 

34 


Como el número mayor (47) indicó que la línea nueva es extraordinaria, el jefe de diseño piensa 
que ésta es una razón para iniciar la producción masiva de los vestidos. El jefe de mantenimien- 
to (que de alguna manera participó en el estudio) considera que no hay una razón clara y afirma 
que las opiniones están distribuidas de manera uniforme entre las seis categorías. Además, 
dice que las pequeñas diferencias entre los diversos conteos quizá se deban a la casualidad. 
Pruebe que en la hipótesis nula no hay una diferencia relevante entre las opiniones de las compra- 
doras. Pruebe con un nivel de riesgo de 0.01. Siga un enfoque formal, es decir, formule la hipóte- 
sis nula, la hipótesis alternativa, etcétera. 
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OA3 Realizar una prueba de 
precisión bondad de ajuste 
para frecuencias desiguales 
esperadas. 

En este problema, las fre- 
cuencias esperadas no son 
iguales. 


Cjemplo 


Solución 


8. El director de seguridad de Honda USA tomó muestras aleatorias de los registros de la compañía 
sobre accidentes menores relacionados con el trabajo, y los clasificó de acuerdo con la hora en 
que ocurrieron. 


Hora 

Número de 
accidentes 

Hora 

Número de 
accidentes 

8 a 9 a.m. 

6 

1 a 2 p.m. 

7 

9 a 10 a.m. 

6 

2 a 3 p.m. 

8 

10 a 11 a.m. 

20 

3 a 4 p.m. 

19 

11 a 12 p.m. 

8 

4 a 5 p.m. 

6 


Utilice la prueba de bondad de ajuste y el nivel de significancia 0.01, y determine si los acciden- 
tes están distribuidos de manera uniforme durante el día. Dé una explicación breve de su conclu- 
sión. 


17.3 Prueba de bondad de ajuste: 
frecuencias esperadas desiguales 

Las frecuencias esperadas (f e ) del ejemplo anterior sobre los platillos preferidos eran iguales. 
De acuerdo con la hipótesis nula, se esperaba que de los 120 adultos que participaron en el 
estudio, un número igual seleccionara cada uno de los cuatro platillos. Así que se esperaba 
que 30 eligieran pollo, 30 eligieran pescados y así sucesivamente. La prueba ji cuadrada tam- 
bién es útil si las frecuencias esperadas no son ¡guales. 

El siguiente ejemplo ¡lustra el caso de frecuencias desiguales y también presenta un uso 
práctico de la prueba de bondad de ajuste de ji cuadrada para determinar si una experiencia 
local difiere de una experiencia más amplia, la nacional, por ejemplo. 


La American Hospital Administrators Association (AHAA) reporta la siguiente información res- 
pecto del número de veces que los adultos mayores son admitidos en un hospital durante un 
periodo de un año. Cuarenta por ciento no es admitido, 30% es admitido una vez, 20% son 
admitidos dos veces y 10% restante es admitido tres o más veces. 

Una encuesta que abarcó a 150 residentes de Bartow Estates, comunidad con una pobla- 
ción predominante de adultos mayores activos en el centro de Florida, reveló que 55 residen- 
tes no ingresaron durante el año pasado, 50 fueron admitidos en un hospital una vez, 32 fueron 
admitidos dos veces, y el resto fueron admitidos tres o más veces. ¿Es posible concluir que la 
encuesta en Bartow Estates es consistente con la información sugerida por la AHAA? Utilice el 
nivel de significancia 0.05. 


Primero organice la información anterior en la tabla 17-4. Es evidente que no puede comparar 
los porcentajes del estudio del Hospital Administrators con las frecuencias reportadas por 
Bartow Estates. Sin embargo, puede convertir estos porcentajes en frecuencias esperadas, f e . 
De acuerdo con Hospital Administrators, 40% de los residentes de Bartow en la encuesta no 
requirió hospitalización. Por lo tanto, si no hay una diferencia entre la experiencia nacional y la 
de Bartow Estates, 40% de los 150 adultos mayores encuestados (60 residentes) no habrían 
sido hospitalizados. Además, 30% de los encuestados fue admitido una vez (45 residentes), 
etc. Las frecuencias observadas en Bartow y las frecuencias esperadas con base en los por- 
centajes del estudio nacional se dan en la tabla 17-4. 
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Estadística en acción 

Muchos gobiernos estata- 
les organizan loterías a fin 
de recaudar fondos para 
la educación. En muchas 
de ellas se mezclan pelo- 
tas numeradas que son 
seleccionadas por una 
máquina. En el juego 
Select Three, las pelotas 
se seleccionan al azar de 
tres grupos de pelotas 
numeradas del cero al 
nueve. La selección alea- 
toria pronostica que la 
frecuencia de cada núme- 
ro sea igual. ¿Cómo 
demostraría que la 
máquina de selección ase- 
gurará que sea aleatoria? 
Puede usar la prueba de 
bondad de ajuste para 
demostrar o desaprobar la 
selección aleatoria. 


TABLA 1 7 4 Resumen del estudio de la AHAA y de una encuesta de los residentes en Bartow Estafes 



Número de 
admisiones 

Porcentaje de AHAA 
del total 

Número de 

residentes en Bartow ( f 0 ) 

Número esperado 
de residentes (f e ) 

0 

40 

55 

60 

1 

30 

50 

45 

2 

20 

32 

30 

3 o más 

10 

13 

15 

Total 

100 

150 

150 


Las hipótesis nula y alternativa son: 

H 0 \ No hay diferencias entre la experiencia local y la nacional respecto de las admisiones 
en un hospital 

H -, : Hay diferencias entre la experiencia local y la nacional respecto de las admisiones en 
un hospital. 

Para determinar la regla de decisión, utilice el apéndice B.3 y el nivel de significancia .05. 
Hay cuatro categorías de admisión, por lo cual los grados de libertad son g/ = 4-1 = 3. El 
valor crítico es 7.815. Así, la regla de decisión es rechazar la hipótesis nula si x 2 > 7.815. La 
gráfica 17-3 es la representación de la regla de decisión. 

Ahora calcule el estadístico de prueba j¡ cuadrada: 


Número de 
admisiones 

(fo) 

(fe) 

fo- fe 

{fo - fe) 2 / fe 

0 

55 

60 

-5 

0.4167 

1 

50 

45 

5 

0.5556 

2 

32 

30 

2 

0.1333 

3 o más 

13 

15 

-2 

0.2667 

Total 

150 

150 

0 

1.3723 



El valor calculado de x 2 (1 .3723) aparece a la izquierda de 7.815. Por lo tanto, no se recha- 
za la hipótesis nula. Conclusión: no hay evidencia de una diferencia entre las experiencias local 
y la nacional respecto de las admisiones en hospitales. 
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Sea cuidadoso al aplicar x 2 
en algunos problemas. 


17.4 Limitaciones de // cuadrada 

Si en una celda existe una frecuencia esperada pequeña Inusual, ji cuadrada (si se aplica) 
puede generar una conclusión errónea. Esto sucede debido a que f e aparece en el denomina- 
dor y, al dividirlo entre un número muy pequeño, hace el cociente muy grande. En general, dos 
pautas aceptadas respecto de las frecuencias de celdas pequeñas son: 

1 . Si sólo hay dos celdas, la frecuencia esperada en cada una deberá ser al menos 5. El 
cálculo de ji cuadrada sería permisible en el siguiente problema para determinar el míni- 
mo de f e de 6. 


Persona 

fe 

fe 

Alfabetizada 

641 

642 

Analfabeta 

7 

6 


2. En caso de más de dos celdas, no se deberá utilizar ji cuadrada si más de 20% de las cel- 
das f e tiene frecuencias esperadas menores que 5. De acuerdo con esta pauta, lo adecua- 
do es utilizar la prueba de bondad de ajuste en los siguientes datos. Tres de las siete 
celdas, o 43%, tienen frecuencias esperadas ( f e ) menores que 5. 


Nivel de administración 

fe 

fe 

Capataz 

30 

32 

Supervisor 

110 

113 

Gerente 

86 

87 

Gerencia de nivel medio 

23 

24 

Asistente del vicepresidente 

5 

2 

Vicepresidente 

5 

4 

Vicepresidente ejecutivo 

4 

1 

Total 

263 

263 


Para demostrar la razón de la pauta de 20%, realice la prueba de bondad de ajuste de los 
datos anteriores en los niveles de administración. La captura de pantalla de MegaStat es la 
siguiente. 


A 

B 

C 

0 

E 

F 

G 

1 

2 Goodnessof Fit Test 





4 

OtMBfVBd 

exoecttd 

O - E 

(O • Ef í E 

% 0f ChlSQ 

s 

30 

32 000 

•2 000 

0 126 

080 


6 

110 

113 000 

•3 000 

0 080 

0 57 


7 

86 

87 000 

•1 000 

0011 

008 


8 

23 

24 000 

•1000 

0 042 

030 


9 

6 

2000 

3000 

4 500 

3212 


10 

5 

4 000 

1000 

0 250 

1 78 


11 

4 

1 ooo 

3 000 

9 000 

64 25 


12 

~ RT“ 

~ 551000 

0 000 

14 008 

100 00 

13 






14 

14 01 chi-square 




li 

6 df 





Ib 

0230 p-vaiu* 
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En el caso de esta prueba, con un nivel de significancia de 0.05, rechace H 0 si el valor cal- 
culado de ji cuadrada es mayor que 12.592. El valor calculado es 14.01, por lo que se recha- 
za la hipótesis nula de que las frecuencias observadas representan una muestra aleatoria de 
la población de los valores esperados. Examine la captura de pantalla de MegaStat. Más de 
98% del valor calculado de ji cuadrada se explica por las tres categorías de vicepresidentes 
([4.500 + 0.250 + 9.000]/14.008 = 0.9815), lo cual es lógico, pues a estas tres categorías se 
les dio mucha ponderación. 

El dilema se resuelve mediante la combinación de categorías si es lógico hacerlo. En el 
ejemplo anterior se combinaron tres categorías de vicepresidentes, lo que satisface la pauta 
de 20%. 


Nivel de 
administración 

fo 

fe 

Capataz 

30 

32 

Supervisor 

110 

113 

Gerente 

86 

87 

Gerencia de 



nivel medio 

23 

24 

Vicepresidente 

14 

7 

Total 

263 

263 


El valor calculado de ji cuadrada con las categorías revisadas es 7.26. Vea la siguien- 
te captura de pantalla de MegaStat. Este valor es menor que el valor crítico de 9.488 para el 
nivel de significancia 0.05. Por lo tanto, la hipótesis nula no se rechaza con el nivel de signi- 
ficancia de 0.05. Esto Indica que no hay una diferencia relevante entre las distribuciones 
observada y esperada. 


SlGoodness of f it i 

A 

e 

C 

0 

E 

f 

0 

32 

33 Goodness of Fit Test 






34 







35 

obsowd 

»xpect«d 

O - E 

(0-EI*/E 

% c4 chisq 

36 

30 

32 000 

-2 000 

0 125 

1 72 


37 

110 

113 000 

•3 000 

0 060 

1 10 


38 

86 

87 000 

-1000 

0 011 

0 16 


39 

23 

24 000 

-1 000 

0 042 

0 57 


40 

II 

7000 

7 000 

7000 

96 45 


41 

263 

263 000 

0 000 

7 258 

100 00 


42 







43 

7 26 chrtquar* 





44 

4 df 






45 

1229 p value 







La American Accounting Association clasifica las cuentas por cobrar como “actuales”, “atrasadas” 
e “irrecuperables”. Las cifras de la industria muestran que 60% de las cuentas por cobrar es actual, 
30% atrasado y 10% irrecuperable. Massa and Barr, despacho de abogados de Greenville, Ohio, 
tiene 500 cuentas por cobrar: 320 son actuales, 120 están atrasadas y 60 son irrecuperables. 
¿Concuerdan estas cifras con la distribución de la industria? Utilice el nivel de significancia 0.05. 
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comed 


Categoría 

fe 

A 

30 

B 

20 

C 

10 


Ejercicios 

9. Con las siguientes hipótesis: 

H 0 : 40% de las observaciones se encuentra en la categoría A, 40% en la categoría B y 20% 
en la C. 

La distribución de las observaciones no es como se describe en H 0 . 

Una muestra de 60 dio ios resultados que se muestran a la izquierda. 

a) Formule la regla de decisión con el nivel de significancia de 0.01 . 

b) Calcule el valor de ji cuadrada. 

c) ¿Cuál es su decisión respecto de H 0 ‘7 

10. Al jefe de seguridad de Malí of the Dakotas se le pidió estudiar el problema de la pérdida de mer- 
cancía. Seleccionó una muestra de 100 cajas que se manipularon de forma indebida y averiguó 
que, en 60 de ellas, los pantalones, zapatos y demás mercancía faltante se debía a hurtos en las 
tiendas. En otras 30 cajas, los empleados sustrajeron las mercancías, y en las restantes 10, lo atri- 
buyó a un control de inventario deficiente. En su reporte a la gerencia del centro comercial, ¿es 
posible que concluyera que tal vez el hurto sea el doble de la causa de la pérdida en comparación 
con el robo por parte de los empleados o un control de inventario deficiente, y que el robo por 
parte de los empleados y el control de inventario deficiente quizá sean iguales? Utilice el nivel de 
significancia 0.02. 

11. El departamento de tarjetas de crédito del Carolina Bank sabe por experiencia que 5% de sus tar- 
jetahabientes terminó algunos años de la preparatoria, 15%, la preparatoria, 25%, algunos años 
de la universidad, y 55%, una carrera. De los 500 tarjetahabientes a quienes se les llamó por no 
pagar sus cargos del mes, 50 terminaron algunos años de preparatoria, 100, la preparatoria, 190, 
algunos años de la universidad, y 160 se graduaron de la universidad. ¿Es posible concluir que la 
distribución de los tarjetahabientes que no pagan sus cargos es diferente a los demás? Utilice el 
nivel de significancia 0.01 . 

12. Durante muchos años, los ejecutivos de televisión dieron crédito a la pauta de que 30% de la 
audiencia veía cada una de las cadenas televisivas de mayor audiencia, y 10%, canales de televi- 
sión por cable durante una noche a la semana. Una muestra aleatoria de 500 televidentes del área 
de Tampa-St. Petersburg, Florida, el pasado lunes por la noche, reveló que 165 hogares sintoniza- 
ron la filial ABC, 140, la filial CBS, 125, la filial NBC, y el resto vio un canal de televisión por cable. 
Con un nivel de significancia de 0.05, ¿es posible concluir que la pauta aún es razonable? 


17.5 Prueba de hipótesis de que 

la distribución de datos proviene 
de una población normal 


OA4 Realizar una prueba de 
hipótesis para verificar que 
los datos agrupados en una 
distribución de frecuencia son 
una muestra de una 
población normal. 


En la sección 17.2, a partir de la página 649, utilizamos la prueba de bondad de ajuste para 
comparar un conjunto observado con un conjunto esperado de observaciones. En el ejemplo 
sobre Bubba’s Fish and Pasta, las frecuencias observadas son los platillos seleccionados por 
una muestra de 120 adultos. Determinamos las frecuencias esperadas asumiendo que no 
existe preferencia por ninguno de los cuatro platillos, así que se espera que una cuarta parte, 
o 30 adultos, elijan cada platillo. En esta sección comparamos las frecuencias observadas, 
agrupadas en una distribución de frecuencia, con las esperadas si las observaciones muéstra- 
les provienen de una población normal. ¿Por qué es importante esta prueba? En la sección 
11.4, al hacer la prueba para encontrar diferencias entre las medias, asumimos que ambas 
poblaciones seguían la distribución normal. Partimos de la misma suposición en la sección 
12.4 cuando tratamos el tema de ANOVA, y en la sección 13.6, cuando describimos la dis- 
tribución de los residuos en una ecuación de regresión de mínimos cuadrados. En la sec- 
ción 13.6 asumimos que la distribución de los residuos seguía una distribución de probabili- 
dad normal. 

El siguiente ejemplo muestra los detalles de esta prueba de bondad de ajuste. 
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Cjemplo 


Solución 


Recuerde que en la sección 2.3 utilizamos una distribu- 
ción de frecuencia para organizar las ganancias de la 
venta de 180 vehículos en Applewood Auto Group. A 
continuación se repite esa distribución de frecuencia. 

TABLA Distribución de frecuencia de las ganan- 
cias por vehículos vendidos el mes pasado 
por Applewood Auto Group 


Ganancia 


Frecuencia 

$ 200 a $ 600 

8 

600 a 

1 000 

11 

1 000 a 

1 400 

23 

1 400 a 

1 800 

38 

1 800 a 

2 200 

45 

2 200 a 

2 600 

32 

2 600 a 

3 000 

19 

3 000 a 

3 400 

4 

Total 


180 



Utilizando un software estadístico determinamos, en la sección 3.8 de la página 69, capí- 
tulo 3, que la ganancia media sobre un vehículo del Applewood Auto Group era de $1 843.17, 
y que la desviación estándar era de $643.63. ¿Es razonable concluir que los datos sobre las 
ganancias son una muestra obtenida de una población normal? En otras palabras, ¿los datos 
de ganancia siguen una distribución normal? Utilizamos el nivel de significancia 0.05. 

Para probar una distribución normal, debemos encontrar las frecuencias esperadas de cada 
clase de dicha distribución, asumiendo que la distribución esperada sigue una distribución 
de probabilidad normal. Iniciamos con la distribución normal calculando las probabilidades de 
cada clase. Después, usamos estas probabilidades para calcular las frecuencias esperadas 
de cada clase. 

Para comenzar, es necesario encontrar el área, o probabilidad, de cada una de las ocho 
clases en la tabla 17-5, asumiendo una población normal con una media de $1 843.17 y una 
desviación estándar de $643.63. Para hallar esta probabilidad, utilizamos la fórmula (7-1). Al 
aplicar esta fórmula, podemos convertir cualquier distribución de probabilidad normal en una 
distribución normal estándar. A continuación se repite la fórmula (7-1): 

x - JJL 
CT 

En este caso, z es el valor de la distribución normal estándar; |x es $1 843.17; y o es $643.63. 
Para ilustrar estos cálculos, seleccionamos la clase $200 a $600 de la tabla 17-5. La meta es 
determinar la frecuencia esperada de esta clase, bajo el supuesto de que la distribución de 
ganancias sigue una distribución normal. Primero, calculamos el valor z correspondiente a 
$200. 


z = 


x — |jl $200 - $1 843.17 

a “ 643.63 


= -2.55 


Este resultado indica que el límite inferior de esta clase está a 2.55 desviaciones estándar por 
debajo de la media. Según el apéndice B.1, la probabilidad de encontrar un valor z menor a 
-2.55 es 0.5000 - 0.4946 = 0.0054. 

En el caso del límite superior de la clase $200 a $600: 


z = 


X - 


f 1 


$600 - $1 843.17 
643.63 


= -1.93 
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El área a la izquierda de $600 es la probabilidad de un valor z menor a -1.93. Para encontrar 
este valor, se utiliza el apéndice B.1 y se calcula que 0.5000 - 0.4732 = 0.0268. 

Finalmente, para encontrar el área entre $200 y $600: 

P($200 < X < $600) = P(— 2.55 < z < -1.93) = .0268 - .0054 = .0214 


Esto es, alrededor de 2.14% de los vehículos vendidos generará una ganancia de entre $200 
y $600. 

Existe una probabilidad de que la ganancia obtenida sea menor a $200. Para encontrarla: 



P(X < $200) = P(z < -2.55) = .5000 - .4946 = .0054 

Ingresamos estas dos probabilidades en la segunda y tercera filas de la columna 3 de la tabla 
17-6. 


TABLA 17-6 Ganancias en Applewood Auto Group, valores z, áreas bajo la distribución normal y 
frecuencias esperadas 


Ganancia 

Valores z 

Área 

Calculada por 

Frecuencia esperada 

Menor a $200 

Menor a -2.55 

.0054 

0.5000 

- 0.4946 

0.97 

$ 200 a $ 600 

-2.55 a -1.93 

.0214 

0.4946 

- 0.4732 

3.85 

600 a 1 000 

-1.93 a -1.31 

.0683 

0.4732 

- 0.4049 

12.29 

1 000 a 1 400 

-1.31 a -0.69 

.1500 

0.4049 

- 0.2549 

27.00 

1 400 a 1 800 

-0.69 a -0.07 

.2270 

0.2549 

- 0.0279 

40.86 

1 800 a 2 200 

-0.07 a 0.55 

.2367 

0.0279 

+ 0.2088 

42.61 

2 200 a 2 600 

0.55 a 1.18 

.1722 

0.3810 

- 0.2088 

31 .00 

2 600 a 3 000 

1.18 a 1.80 

.0831 

0.4641 

- 0.3810 

14.96 

3 000 a 3 400 

1.80 a 2.42 

.0281 

0.4922 

- 0.4641 

5.06 

3 400 o más 

2.42 o más 

.0078 

0.5000 

- 0.4922 

1.40 

Total 


1.0000 



180.00 


Lógicamente, si se vendieron 180 vehículos, se espera obtener una ganancia de entre 
$200 y $600 en 3.852 de ellos, calculado por 0.0214(180). Se esperaría vender 0.972 vehícu- 
los con una ganancia menor a $200, calculada por 180(0.0054). El proceso continúa con las 
clases restantes. Esta información se resume en la tabla 17-7, en la página siguiente. No se 
preocupe de que se estén reportando fracciones de vehículos. 

Antes de seguir, debemos destacar una de las limitaciones de las pruebas que utilizan ji 
cuadrada como estadístico de prueba. La segunda limitación, que se encuentra en la sección 
1 7.4, en la página 657, indica que si más de 20% de las celdas tienen frecuencias esperadas 
menores a 5, deben combinarse algunas de las categorías. En la tabla 17-6 hay tres clases en 
donde las frecuencias esperadas son menores a 5. Por lo tanto, combinamos la clase “Menor 
a $200” con la clase “$200 a $600”, y la clase “$3 400 o más” con la clase “$3 000 a $3 400”. 
Por ello, la frecuencia esperada en la clase “Menor a $600” es ahora 4.82, calculada por 0.97 
más 3.85. Hacemos lo mismo con la clase “$3 000 o más”: 5.06 + 1.40 = 6.46. Los resulta- 
dos se muestran en la tabla 17-7, en la página siguiente. El valor calculado de ji cuadrada es 
5.220. 

Ahora pongamos esta información en un formato formal de prueba de hipótesis. Las hipó- 
tesis nula y alternativa son: 

H 0 \ La población de ganancias sigue la distribución normal. 

H -, : La población de ganancias no sigue la distribución normal. 

Para determinar el valor crítico de ji cuadrada, es necesario saber los grados de libertad. 
En este caso, hay 8 categorías, o clases, así que los grados de libertad son A— 1 = 8 — 1 =7. 


662 


CAPÍTULO 17 Métodos no paramétrícos: pruebas de bondad de ajuste 


TABLA 17-7 Cálculo del estadístico ji cuadrada 



Además, los valores $1 843.17, la ganancia media y $643.63, la desviación estándar de las 
ganancias de Applewood Auto Group, se calcularon a partir de una muestra. Cuando estima- 
mos parámetros poblacionales a partir de datos muéstrales, perdemos un grado de libertad por 
cada estimación, de modo que perdemos dos grados más de libertad por estimar la media 
poblacional y la desviación estándar de la población. Así, el número de grados de libertad en 
este problema es 5, calculados por k - 2-1 = 8- 2-1 =5. 

De acuerdo con el apéndice B.3, utilizando el nivel de significancia 0.05, el valor crítico de 
ji cuadrada es 11.070. La regla de decisión es rechazar la hipótesis nula si el valor calculado 
de ji cuadrada es mayor a 1 1 .070. 

Para calcular el valor de ji cuadrada, utilizamos la fórmula (17-1): 


X 


2 


^ ifo ~ fe) 2 = (8 - 4.82) 2 (4 ~ 6.46) 2 = 

^ f e 4.82 6.46 


Los valores de cada clase se muestran en la columna de la derecha de la tabla 17-7, así como 
en la columna total, que es 5.220. Debido a que el valor calculado de 5.220 es menor que el 
valor crítico, no rechazamos la hipótesis nula. Se concluye que la evidencia no sugiere que la 
distribución de ganancias sea distinta de la normal. 


Para expandir el cálculo del número de grados de libertad, si se conoce la media y la des- 
viación estándar de una población, y se desea determinar si algunos de los datos muéstrales 
se conforman a una normal, los grados de libertad son k - 1. Por otra parte, suponga que 
tenemos a los datos de muestra agrupados en una distribución de frecuencia, pero no sabe- 
mos el valor de la media poblacional ni de la desviación estándar de la población. En este 
caso, los grados de libertad son k — 2 — 1. En general, cuando utilizamos estadísticas de 
muestras para estimar parámetros poblacionales, se pierde un grado de libertad por cada 
parámetro estimado. Esto es paralelo a la situación que se planteó en la sección 14.4 de ese 
capítulo sobre la regresión múltiple, donde se perdió un grado de libertad en el denominador 
del estadístico F por cada variable independiente considerada. 


OA5 Utilizar los métodos 
gráficos y estadísticos para 
determinar si un grupo de 
datos muéstrales proviene de 
una población normal. 


17.6 Enfoques gráficos y estadísticos 
para confirmar la normalidad 

Una desventaja de la prueba de bondad de ajuste de la normalidad es que se compara una 
frecuencia de distribución de un conjunto de datos con un grupo esperado de frecuencias de 
distribución normal. Cuando se organizan los datos en distribución de frecuencias, se sabe 
que se pierde información con respecto a esos datos. Esto es, no se tienen los datos crudos. 
Existen varias pruebas en que se usan datos crudos en vez de utilizar datos agrupados en una 
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distribución de frecuencias. Estas pruebas incluyen las pruebas de normalidad Kolmogorob- 
Smirinov, Lilliefors y Anderson-Darling. Para complementar estas pruebas estadísticas, se dis- 
pone de métodos gráficos para tener un acceso visual a la normalidad de una distribución. Se 
utilizan valores p para evaluar la hipótesis de normalidad. 

Nos enfocaremos en la prueba de normalidad Anderson-Darling, que se basa en dos 
pasos: 

1. Se crean dos distribuciones acumulativas. La primera es una distribución acumulativa de 
los datos crudos y, la segunda, es una distribución acumulativa normal. 

2. Se comparan las dos distribuciones acumulativas para determinar la mayor diferencia 
numérica absoluta entre ambas. Utilizando una prueba estadística, si la diferencia es 
amplia, se rechaza la hipótesis nula de que los datos siguen una distribución normal. 

Además, se puede graficar la distribución acumulativa de los datos crudos y la distribu- 
ción acumulativa normal. La gráfica de la distribución acumulativa normal es una línea recta. 
La gráfica de los datos rudos estará diseminada alrededor de la recta que representa la acu- 
mulativa normal. Mediante la gráfica, se puede observar que los datos están normalmente dis- 
tribuidos si la diseminación está relativamente cerca de la línea recta que representa la 
distribución acumulativa normal. 

Para demostrar la prueba de normalidad Anderson-Darling, usaremos los datos de las 
ganancias de Applewood Auto Group que se muestran en la tabla 2-4. Utilizando métodos grá- 
ficos, podemos comparar la distribución acumulativa de la ganancia individual en la tabla 2.4 
con una distribución acumulativa normal. Buscamos diferencias entre ambas gráficas. Como 
buscamos distribuciones acumulativas, las gráficas aumentarán de izquierda a derecha. En la 
gráfica que se muestra a continuación, los puntos negros representan la ganancia que se 
obtuvo en cada uno de los 180 vehículos que vendió Applewood Auto Group. Los puntos 
están cerca unos de otros y parecen formar una curva. La línea verde, que está casi cubierta 
por puntos negros, representa la distribución normal acumulativa. La gráfica muestra que los 
datos de ganancias siguen de cerca la línea verde, y que la distribución de ganancias sigue 
muy de cerca una distribución normal. 


Prueba de normalidad Anderson-Darling 
Normal 



La distribución de ganancias parece alejarse de una distribución normal en las colas, pero, 
¿es este alejamiento suficiente para rechazar la idea de que las ganancias siguen una distri- 
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Autoevaluación 17-3 



bución normal? Se puede usar la prueba de Anderson-Darling para evaluar estas diferencias. 
En esta prueba, las hipótesis nula y alternativa son las siguientes: 

H 0 : La población de ganancias sigue una distribución normal. 

H 1 : La población de ganancias no sigue una distribución normal. 

Los detalles del cálculo de la prueba de Anderson-Darling están fuera del espectro de este 
texto. Sin embargo, mediante un software estadístico, puede observar en el recuadro del 
ángulo superior derecho de la gráfica que se han resumido los cinco estadísticos de la prue- 
ba. Se muestran la media, la desviación estándar y el tamaño de la muestra. “AD” es el esta- 
dístico de la prueba de Anderson-Darling que se utiliza para probar la hipótesis nula. Como se 
presentó en el capítulo 10, cada estadístico de prueba posee un valor p que se utiliza para 
tomar una decisión con respecto a la hipótesis nula. Elegimos 0.05 como el nivel de significan- 
cia para esta prueba, y empleamos la regla de decisión de que si el valor p es mayor que el 
nivel de significancia, no se rechaza la hipótesis nula. Como el valor p es 0.602, no rechaza- 
mos la hipótesis nula. Así que en este caso, con base en los métodos gráficos y al valor p cal- 
culado, inferimos que es razonable asumir que las ganancias siguen una distribución normal. 


Consulte la autoevaluación 10-4 en la página 355. En ese problema, una máquina se calibra para 
llenar una pequeña botella con 9.0 gramos de medicamento. Una muestra de ocho botellas reveló 
las siguientes cantidades (en gramos) en cada botella. Se realizó una prueba de hipótesis con res- 
pecto a la media. Para hacer la prueba, la suposición fue que los datos muéstrales seguían una dis- 
tribución normal. 


9.2 

8.7 

8.9 

8.6 

8.8 

8.5 

8.7 

9.0 


A continuación se presenta una gráfica que muestra una distribución acumulativa normal y las fre- 
cuencias acumulativas de los pesos. ¿Es razonable la suposición normal? Cite dos evidencias que 
sustenten su decisión. Utilice un nivel de significancia de 0.01 . 
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comed; 


Ejercicios 

13. Consulte el ejercicio 61 del capítulo 3. El IRS estaba interesado en el número de declaraciones de 
impuestos individuales preparadas por pequeñas firmas contables. Seleccionó al azar una mues- 
tra de 50 despachos contables que tuvieran 10 empleados o menos en el área de Dallas-Fort- 
Worth. La siguiente tabla de frecuencias reporta los resultados del estudio. Suponga que la media 
muestral es 44.8 clientes y que la desviación estándar de la muestra es 9.37 clientes. ¿Es razona- 
ble concluir que los datos muéstrales provienen de una población que sigue una distribución de 
probabilidad normal? Utilice un nivel de significancia de 0.05. m 


Número de clientes 

Frecuencia 

20 a 30 

1 

30 a 40 

15 

40 a 50 

22 

50 a 60 

8 

60 a 70 

4 


14. Consulte el ejercicio 62 del capítulo 3. Los gastos publicitarios son un componente significativo 
del costo de venta de los bienes. Abajo se presenta una distribución de frecuencia que muestra 
los gastos publicitarios de 60 compañías manufactureras ubicadas en el Sudoeste de Estados 
Unidos. El gasto medio es de $52.0 millones, y la desviación estándar, $11.32 millones. ¿Es razo- 
nable concluir que los datos muéstrales provienen de una población que sigue una distribución de 
probabilidad normal? Utilice un nivel de significancia de 0.05. m 


Gastos publicitarios 
(millones de dólares) 

Número de compañías 

25 a 35 

5 

35 a 45 

10 

45 a 55 

21 

55 a 65 

16 

65 a 75 

8 

Total 

60 


15. Consulte el ejercicio 72 del capítulo 3, página 96. La Asociación Americana de Diabetes recomien- 
da una lectura de glucosa sanguínea de menos de 130 para quienes tienen diabetes Tipo 2. La 
glucosa sanguínea mide la cantidad de azúcar en la sangre, y la diabetes Tipo 2 suele aparecer en 
adultos mayores. A continuación se presentan las lecturas de febrero de una persona mayor 
recientemente diagnosticada. 


112 

122 

116 

103 

112 

96 

115 

98 

106 

111 

106 

124 

116 

127 

116 

108 

112 

112 

121 

115 

124 

116 

107 

118 

123 

109 

109 

106 




¿Es razonable concluir que estas cifras siguen una distribución normal? Utilice un nivel de signifi- 
cancia de 0.05. Mediante el siguiente análisis, pruebe la hipótesis nula de que la distribución de 
tiempos es normal. Cite dos razones que avalen su decisión. 

16. Consulte el ejercicio 80 del capítulo 3, página 97. Creek Ratz es una popular cadena de restauran- 
tes ubicada a lo largo de la costa norte de Florida. En ellos sirven una variedad de platillos de carne 
y mariscos. Durante la temporada de verano, no toman reservaciones ni aceptan “lugares previa 
cita”. La administración está preocupada por el tiempo que un cliente debe esperar antes de ser 
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Trazo de probabilidad de las lecturas 
Normal 



Lectura 


llevado a su mesa. A continuación se presenta el tiempo, en minutos, de 25 mesas la noche del 
sábado pasado. 


28 

39 

23 

67 

37 

28 

56 

40 

28 

50 

51 

45 

44 65 61 

27 

24 

61 

34 

44 

64 

25 

24 

27 

29 





¿Es razonable concluir que estas lecturas siguen una distribución normal? Utilice un nivel de sig- 
nificancia de 0.05. Mediante el siguiente análisis, pruebe la hipótesis nula de que la distribución de 
tiempos es normal. Cite dos razones que avalen su decisión. 


Trazo de probabilidad de los tiempos 
Normal 



Tiempo 
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17.7 Análisis de tablas de contingencia 



En el capítulo 4 se analizaron datos bivariados, y se estudió la rela- 
ción entre dos variables. Se describió una tabla de contingencia, 
que resume de manera simultánea dos variables de interés de esca- 
la nominal; por ejemplo, una muestra de estudiantes inscritos en la 
School of Business por género (masculino o femenino) y especiali- 
dad (contabilidad, administración, finanzas, marketing o métodos 
cuantitativos). Esta clasificación tiene como base la escala nominal 
debido a que las clasificaciones no siguen un orden natural. 

En el capítulo 5 se estudiaron las tablas de contingencia. En 
la página 163 se ¡lustró la relación entre la lealtad a una compañía 
y la duración en el trabajo, y se exploró si era probable que los 
empleados con más antigüedad fuesen más leales a la compañía. 

El estadístico // cuadrada sirve para probar de manera formal si 
hay una relación entre dos variables con escala nominal. En otras 
palabras, ¿es independiente una variable de la otra? Los siguien- 
tes son algunos ejemplos interesantes para probar si dos variables 
están relacionadas. 


0A6 Realizar la prueba de 
ji cuadrada de la indepen- 
dencia en una tabla de 
contingencia. 


• La Ford Motor Company opera una planta de ensamble en Dearborn, Michigan. La plan- 
ta opera tres turnos por día, 5 días a la semana. El gerente de control de calidad quiere 
comparar el nivel de calidad en los tres turnos. Los vehículos se clasifican por sus niveles 
de calidad (aceptable, inaceptable) y por turnos (matutino, vespertino, nocturno). ¿Hay 
alguna diferencia en el nivel de calidad en los tres turnos? Es decir, ¿está relacionada la 
calidad del producto con el turno que lo fabricó? ¿O es independiente la calidad del pro- 
ducto del turno que lo fabricó? 

• Una muestra de 100 conductores detenidos por rebasar los límites de velocidad se clasi- 
ficó por género y el uso del cinturón de seguridad. En esta muestra, ¿el uso del cinturón 
de seguridad se relaciona con el género? 

• ¿Un hombre liberado de una prisión federal tiene una adaptación diferente a la vida civil 
si regresa a su ciudad natal o si se va a vivir a otra parte? Las dos variables son: adapta- 
ción a la vida civil y lugar de residencia. Observe que las dos variables se miden en una 
escala nominal. 


r 

Cjemplo 

La Federal Correction Agency investiga la última pregunta: ¿un hombre liberado de una prisión 
federal se adapta de manera diferente a la vida civil si regresa a su ciudad natal o si va a vivir 


a otra parte? En otras palabras, ¿hay una relación entre la adaptación a la vida civil y el lugar 
de residencia después de salir de prisión? 

Utilice el nivel de significancia 0.01. 

Solución 

Como antes, el primer paso en la prueba de hipótesis es formular las hipótesis nulas y alterna- 
tiva. 


H 0 : No hay relación entre la adaptación a la vida civil y el lugar donde se radique el indi- 
viduo después de salir de la prisión. 

Hy. Hay relación entre la adaptación a la vida civil y el lugar donde se radique el individuo 
después de salir de prisión. 


Los psicólogos de la dependencia entrevistaron a 200 exprisioneros seleccionados de 
manera aleatoria. Mediante una serie de preguntas, los psicólogos clasificaron la adaptación 
de cada individuo a la vida civil como sobresaliente, buena, regular o insatisfactoria. Las clasi- 
ficaciones de los 200 exprisioneros se ordenaron de la siguiente manera. Por ejemplo, Joseph 
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Camden regresó a su ciudad natal y tuvo una adaptación extraordinaria a la vida civil. Su caso 
es una de las 27 marcas en el recuadro superior izquierdo. 


Residencia 
al salir de 
prisión 

Adaptación a la vida civil 

Sobresaliente 

Buena 

Regular 

Insatisfactoria 

Ciudad natal 

iftí IHUH1 

IHHH1 II 

IH1IHUH1 

un im un 

LUI 

un un luí 

un un un 

/// 

un un un 

un un 

IHUH1 III 

IH1 Utl LUI 

un un un 

un un u 

un un un 

un un 


La tabla de contingencia 
consiste en datos contados. 


Se contaron las marcas en cada recuadro, o celda. Los conteos se dan en la siguiente 
tabla de contingencia. (Vea la tabla 17-8.) En este caso, a la Federal Correction Agency le 
interesa determinar si el ajuste a la vida civil es contingente respecto del lugar donde vaya el 
prisionero después de salir en libertad. 



Estadística en acción 


Un estudio de 1 000 esta- 
dounidenses mayores de 
24 años reveló que 28% 
nunca se ha casado. De 
ellos, 22% terminó la 
universidad; 23% de los 
1 000 se casó y terminó la 
universidad. ¿Es posible 
concluir, con esta infor- 
mación, que estar casado 
se relaciona con terminar 
la universidad? El estudio 
indicó que había una 
relación entre las dos 
variables, que el valor cal- 
culado del estadístico ji 
cuadrada fue 9.368, y el 
valor p, 0.002. ¿Puede 
repetir estos resultados? 


TABLA 1 Adaptación a la vida civil y lugar de residencia 


Residencia 
al salir de 
prisión 

Adaptación a la vida civil 



Sobresaliente 

Buena 

Regular 

Insatisfactoria 

Total 

Ciudad natal 

27 

35 

33 

25 

120 

No en la ciudad natal 

13 

15 

27 

25 

80 

Total 

40 

50 

60 

50 

200 


Una vez que conoce cuántas filas (2) y columnas (4) hay en la tabla de contingencia, puede 
determinar el valor crítico y la regla de decisión. En la prueba de significación ¡i cuadrada 
donde los rasgos se clasifican en una tabla de contingencia, los grados de libertad se obtie- 
nen por medio de: 

gl = (número de filas - 1)(número de columnas - 1) = (r - 1)(c - 1) 

En este problema: 

gl = (r “ 1)(c - 1) = (2 - 1)(4 - 1) = 3 

Para encontrar el valor crítico de 3 grados de libertad y el nivel de 0.01 (seleccionado 
antes), consulte el apéndice B.3. Es 11.345. La regla de decisión es: rechace la hipótesis nula 
si el valor calculado de x 2 es mayor que 1 1 .345. La regla de decisión se representa visualmen- 
te en la gráfica 17-4. 

A continuación se determina el valor calculado de x 2 - Las frecuencias observadas, f 0 , se 
muestran en la tabla 1 7-8. ¿Cómo se determinan las frecuencias esperadas correspondientes, 
4? Observe en la columna “Total” de la tabla que 120 de los 200 exprlsioneros (60%) regresa- 
ron a sus ciudades natales. Si no hubiera relación entre la adaptación y la residencia después 
de salir de prisión, se debería esperar que 60% de los 40 exprisioneros que tuvieron una adap- 
tación sobresaliente a la vida civil viviera en su ciudad natal. Por lo tanto, la frecuencia espe- 
rada f e de la celda superior izquierda es 0.60 X 40 = 24. De igual forma, si no hubiera relación 
entre la adaptación y la residencia actual, esperaría que 60% de los 50 exprisioneros (30%) 
que tenían una adaptación “buena” a la vida civil viviera en su ciudad natal. 
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GRÁFICA 17-4 



Además, observe que 80 de los 200 exprisioneros (40%) no regresaron a vivir a su ciudad 
natal. Por lo tanto, de los 60 que los psicólogos consideraron con una adaptación “regular” a 
la vida civil, se esperaría que 0.40 x 60, o sea 24, no regresaran a su ciudad natal. 

La determinación de la frecuencia esperada en cualquier celda es: 




FRECUENCIA ESPERADA 


V 


(Total de filas)(Total de columnas) 
Gran total 




(17-2) 




A partir de esta fórmula, la frecuencia esperada en la celda superior izquierda en la tabla 17.5 
es: 


_ , (Total de filas)(Total de columnas) (120)(40) 

Frecuencia esperada — = = 24 

K Gran total 200 

Las frecuencias observadas, f a , y las frecuencias esperadas, f e , de todas las celdas de la tabla 
de contingencia se presentan en la tabla 17-9. 


TABLA 17-9 Frecuencias observadas y esperadas 


Residencia 
al salir de 
prisión 

Adaptación a la vida civil 

Sobresaliente 

Buena 

Regular 

Insatisfactoria 

Total 

fo fe 

fo fe 

fe fe 

fo fe 

fe fe 

Ciudad natal 

No en la ciudad natal 

27 24 

35 30 

33 36 

25 30 

120 120 

13 16 

15 20 

27 24 

25 20 

80 80 

Total 

40 40 50 50\ 60 60 

\ / \ 

50 50 

200 200 

I I 

Deben ser 
iguales 

(80)(50) 

200 

Deben ser 
iguales 
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Inicie en la celda superior izquierda: 

2 _ (27 - 24 ) 2 (35 - 30) 2 (33 - 36) 2 (25 - 30) 2 

X ~~ 24 + 30 + 36 + 30 

(13 — 16) 2 (15 - 20) 2 (27 - 24) 2 (25 - 20) 2 

+ 16 + 20 + 24 + 20 

= 0.375 + 0.833 + 0.250 + 0.833 + 0.563 + 1.250 + 0.375 + 1.250 
= 5.729 

Como el valor calculado de ji cuadrada (5.729) aparece en la región a la izquierda de 
11.345, no se rechaza la hipótesis nula con un nivel de significancia de 0.01. Conclusión: no 
hay evidencia de una relación entre la adaptación a la vida civil y el lugar de residencia del indi- 
viduo al salir de prisión. Para el programa de recomendaciones de la Federal Correction 
Agency, la adaptación a la vida civil no se relaciona con el lugar donde viva el exprisionero. 


La siguiente es una captura de pantalla del sistema Minitab. 



Observe que el valor de ji cuadrada es el mismo que el que se calculó antes. Además, el 
valor p reportado es 0.126. Por lo tanto, la probabilidad de encontrar un valor del estadístico 
de prueba igual o mayor es 0.126 cuando la hipótesis nula es verdadera. El valor p también da 
por resultado la misma decisión: no se rechaza la hipótesis nula. 



Un científico social tomó una muestra de 140 personas y las clasificó de acuerdo con su nivel de 
ingresos, y si jugaron o no en la lotería estatal el mes pasado. La información de la muestra aparece 
a continuación. ¿Es posible concluir que jugar a la lotería se relaciona con el nivel de ingresos? 
Utilice el nivel de significancia 0.05. 



Bajo 

Ingreso 

Medio 

Alto 

Total 

Jugaron 

46 

28 

21 

95 

No jugaron 

14 

12 

19 

45 

Total 

60 

40 

40 

140 
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a) ¿Cómo se denomina esta tabla? 

b) Formule las hipótesis nula y alternativa. 

c) ¿Cuál es su regla de decisión? 

d) Determine el valor de /'/ cuadrada. 

e) Tome una decisión respecto de la hipótesis nula. Interprete el resultado. 


comed: 


Ejercicios 


17 . 


La directora de publicidad del Carolina Sun Times, el periódico más importante de Carolina del 
Norte y del Sur, estudia la relación entre el tipo de comunidad en que residen sus suscriptores y la 
sección del periódico que leen primero. De una muestra de lectores recopiló la siguiente informa- 


ción. g¡| 



Noticias 

nacionales 

Deportes 

Tiras 

cómicas 

Ciudad 

170 

124 

90 

Suburbios 

120 

112 

100 

Rural 

130 

90 

88 


Con un nivel de significancia de 0.05, ¿se puede concluir que existe relación entre el tipo de comu- 
nidad donde reside la persona y la sección del periódico que lee primero? 

18. Se considera usar cuatro marcas de lámparas en el área de ensamblado final de la planta Saturn 
de Spring HUI, Tennessee. El director de compras pidió muestras de 100 lámparas de cada fabri- 
cante. Los números de lámparas aceptables e inaceptables de cada fabricante aparecen en la 
siguiente tabla. Con un nivel de significancia de 0.05, ¿hay una diferencia entre las calidades de 
las lámparas? gj| 


Fabricante 


A B C D 


Inaceptable 

12 

8 

5 

11 

Aceptable 

88 

92 

95 

89 

Total 

100 

100 

100 

100 


19. El departamento de control de calidad de Food Town, Inc., cadena de abarrotes del norte de 
Nueva York, mensualmente compara los precios registrados con los precios anunciados. La 
siguiente tabla resume los resultados de una muestra de 500 artículos del mes pasado. La geren- 
cia de la compañía quiere saber si existe relación entre las tasas de error de los artículos con pre- 
cios normales y los artículos con precios especiales. Utilice el nivel de significancia 0.01. 



Precio regular 

Precio especial anunciado 

Precio bajo 

20 

10 

Precio mayor 

15 

30 

Precio correcto 

200 

225 


20. El uso de teléfonos celulares en automóviles aumentó de forma impresionante en los últimos años. 
El efecto en los índices de accidentes es de interés para los expertos de tránsito, así como para 
los fabricantes de teléfonos celulares. ¿Es más probable que quien usa un teléfono celular se vea 
involucrado en un accidente de tránsito? ¿Cuál es su conclusión a partir de la siguiente informa- 
ción? Utilice el nivel de significancia 0.05. 



Tuvo un accidente 

No tuvo un accidente 


el año pasado 

el año pasado 

Usa teléfono celular 

25 

300 

No usa teléfono celular 

50 

400 
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Resumen del capítulo 

I. Las características de la distribución ji cuadrada son: 

A. El valor de ji cuadrada nunca es negativo. 

B. La distribución ji cuadrada tiene sesgo positivo. 

C. Hay una familia de distribuciones ji cuadrada. 

1. Cada vez que cambian los grados de libertad, se forma una nueva distribución. 

2. A medida que aumentan los grados de libertad, ia distribución se aproxima a una distribu- 
ción normal. 

II. Una prueba de bondad de ajuste indicará si un conjunto de frecuencias observadas puede prove- 
nir de una distribución normal. 

A. Los grados de libertad son k — 1 , donde k es el número de categorías. 

B. La fórmula para calcular el valor de ji cuadrada es 


X 2 = 2 


(f 0 - f e ) 2 


(17-1) 


III. La prueba de bondad de ajuste puede utilizarse también para determinar si una muestra de obser- 
vaciones proviene de una población normal. 

A. Primero, encontrar la media y la desviación estándar de los datos muéstrales. 

B. Agrupar los datos en una distribución de frecuencia. 

C. Convertir los límites de clase a valores z y encontrar la distribución estándar de probabilidad nor- 
mal de cada clase. 

D. Encontrar la frecuencia esperada de distribución normal de cada clase, multiplicando la distri- 
bución estándar de probabilidad normal por la frecuencia de clase. 

E. Calcular el estadístico de bondad de ajuste ji cuadrada, basándose en la frecuencia de clase 
observada y esperada. 

F. Encontrar la frecuencia esperada de cada celda determinando el producto de la probabilidad de 
encontrar un valor en cada celda por el número total de celdas. 

G. Si utiliza la información de la media muestral y la desviación estándar de la muestra de los datos 
muéstrales, los grados de libertad son k - 3. 

IV. Una tabla de contingencia sirve para probar si hay relación entre dos rasgos o características. 

A. Cada observación se clasifica de acuerdo con dos rasgos. 

B. La frecuencia esperada se determina de la siguiente manera: 

(Total de filas)(Total de columnas) (17 2) 

e Gran total 

C. Los grados de libertad se determinan mediante: 

gl = (Filas - 1)(Columnas - 1) 

D. Se emplea el procedimiento de prueba de hipótesis habitual. 


Clave de pronunciación 


SÍMBOLO 

x 2 

fe 

fe 


SIGNIFICADO 

Distribución de probabilidad 
Frecuencia observada 
Frecuencia esperada 


PRONUNCIACIÓN 

ji cuadrada 
f subíndice o 
f subíndice e 


comect 


Ejercidos del copítulo 

21. Los vehículos que se dirigen hacia el oeste sobre Front Street pueden dar vuelta a la derecha, a la 
izquierda o seguir de frente hacia Elm Street. El ingeniero de tráfico de la ciudad considera que la 
mitad de los vehículos continuará de frente cruzando la intersección. De la mitad restante, propor- 
ciones iguales darán vuelta a la derecha e izquierda. Se observaron 200 vehículos, con los siguien- 
tes resultados. ¿Es posible concluir que el ingeniero de tráfico tiene razón? Utilice el nivel de 
significancia 0.10. 



De frente 

Vuelta a la derecha 

Vuelta a la izquierda 

Frecuencia 

112 

48 

40 
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22 . El editor de una revista deportiva piensa ofrecer a los nuevos suscriptores uno de tres regalos: una 
sudadera, una taza o un par de aretes, todos ellos con el logotipo de su equipo favorito. En una 
muestra de 500 suscriptores nuevos, el número seleccionado de regalos aparece en la siguiente 
tabla. Con un nivel de significancia de 0.05, ¿existe una preferencia por los regalos o es posible 
concluir que esta preferencia es igual? 


Regalo 

Frecuencia 

Sudadera 

183 

Taza 

175 

Aretes 

142 


23 . En un mercado hay tres estaciones de televisión comerciales, cada una con su propio noticiero de 
6:00 a 6:30 p.m. De acuerdo con ei reporte de un periódico local matutino, una muestra aleatoria 
de 150 televidentes reveló que anoche 53 vieron las noticias en WNAE (canal 5), 64 en WRRN 
(canal 1 1) y 33 en WSPD (canal 13). Con un nivel de significancia de 0.05, ¿hay una diferencia entre 
las proporciones de televidentes que ven los tres canales? 

24 . Hay cuatro entradas en el Government Center Building, en el centro de Filadelfia. Al supervisor de 
mantenimiento del edificio le gustaría saber si las entradas se utilizan por igual. Para investigar 
esto, observó a 400 personas que entraron al edificio. El número de personas por cada entrada 
aparece en la siguiente tabla. Con un nivel de significancia de 0.01 , ¿hay una diferencia entre el 
empleo de las cuatro entradas? ^ 


Entrada 

Frecuencia 

Main Street 

140 

Broad Street 

120 

Cherry Street 

90 

Walnut Street 

50 

Total 

400 


25 . El propietario de un negocio de ventas por catálogo quiere comparar sus ventas con la distribu- 
ción geográfica de la población. De acuerdo con el United States Bureau of the Census, 21 % de 
la población vive en el noreste, 24% en el medio oeste, 35% en el sur y 20% en el oeste. El des- 
glose de una muestra de 400 pedidos seleccionados de manera aleatoria de los envíos del mes 
pasado aparece en la siguiente tabla. Con un nivel de significancia de 0.01 , ¿la población refleja la 
distribución de los pedidos? m 


Región 

Frecuencia 

Noreste 

68 

Medio oeste 

104 

Sur 

155 

Oeste 

73 

Total 

400 


26. Banner Mattress and Furniture quiere estudiar el número de solicitudes de crédito que recibió por 
día durante los últimos 300 días. La información aparece a continuación. 


Número de 
solicitudes 
de crédito 

Frecuencia 
(número de dias) 

0 

50 

1 

77 

2 

81 

3 

48 

4 

31 

5 o más 

13 
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Para interpretar los datos anteriores, hubo 50 días en los que no se recibieron solicitudes de cré- 
dito, 77 en los que sólo se recibió una solicitud, etc. ¿Es razonable concluir que la distribución de 
población tiene una distribución de Poisson con una media de 2.0? Utilice el nivel de significancia 
0.05. Sugerencia: Para determinar las frecuencias esperadas utilice la distribución de Poisson con 
una media de 2.0. Encuentre la probabilidad exacta de un éxito dada una distribución de Poisson 
con una media de 2.0. Multiplique esta probabilidad por 300 para encontrar la frecuencia espera- 
da del número de días en que hubo exactamente una solicitud. De manera similar, determine la fre- 
cuencia esperada de los demás días. 

27 . Se piensa que cada uno de los dígitos de una rifa tiene la misma probabilidad de salir. La siguien- 
te tabla muestra la frecuencia de cada dígito al ser elegido al azar y consecutivamente en la lote- 
ría de California. Realice la prueba de ¡i cuadrada para ver si rechaza la hipótesis de que los dígitos 
provienen de una población uniforme, a un nivel de significancia de 0.05. 5¡ J 


Dígito 

Frecuencia 

Dígito 

Frecuencia 

0 

44 

5 

24 

1 

32 

6 

31 

2 

23 

7 

27 

3 

27 

8 

28 

4 

23 

9 

21 


28 . John Isaac Inc., un diseñador e instalador de señalamientos industriales, tiene 60 empleados. La 
compañía registró el tipo de la más reciente visita al médico de cada empleado. Una evaluación 
nacional que se realizó en Estados Unidos en 2004 reveló que 53% de todas las visitas al médico 
eran a profesionales de atención primaria, 19% a especialistas, 17% a cirujanos y 1 1 % a atención 
de emergencia. A un nivel de significancia de 0.01, pruebe si los empleados de Isaac difieren sig- 
nificativamente de la distribución derivada de la encuesta. Aquí están los resultados: m 


Tipo de visita 

Número de visitas 

Atención primaria 

29 

Especialista 

11 

Cirujano 

16 

Emergencia 

4 


29 . La Eckel Manufacturing Company piensa que sus salarios por hora siguen una distribución de pro- 
babilidad normal. Para confirmarlo se eligió una muestra de 300 empleados, organizados en la 
siguiente distribución de frecuencia. Utilice los métodos de la sección 3.15, capítulo 3, para encon- 
trar la media y la desviación estándar de estos datos agrupados en una distribución de frecuen- 
cia. A un nivel de significancia de 0.10, ¿es razonable concluir que la distribución de los salarios 
mensuales sigue una distribución normal? ^ 


Salario por hora 

Frecuencia 

$5.50 a $ 

6.50 

20 

6.50 a 

7.50 

24 

7.50 a 

8.50 

130 

8.50 a 

9.50 

68 

9.50 a 

10.50 

28 

Total 


300 


30 . La Asociación Nacional de Cable y Telecomunicaciones reportó que el número medio de televiso- 
res de alta definición (HD) por hogar en Estados Unidos es 2.30, con una desviación estándar de 


Ejercicios del capítulo 
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1.474 televisores. Una muestra de 100 hogares en Boise, Idaho, reveló la siguiente información 
muestral. m 


Número de HDTV 

Número de hogares 

0 

7 

1 

27 

2 

28 

3 

18 

4 

10 

5 o más 

10 

Total 

100 


A un nivel de significancia de .05, ¿es razonable concluir que el número de HDTV por hogar sigue 
una distribución normal? ( Sugerencia : Utilice límites como 0.5 a 1.5, 1.5 a 2.5, y así sucesiva- 
mente.) 

31. A continuación se reportan las inscripciones a las 13 universidades estatales de Ohio. Asumiendo 
que ésta es la información muestra, ¿es razonable concluir que las inscripciones siguen una dis- 
tribución normal? Utilice un nivel de significancia de 0.05. 


Universidad 

Inscripciones 

University of Akron 

25 942 

Bowllng Green State University 

18 989 

Central State University 

1 820 

University of Cincinnati 

36 415 

Cleveland State University 

15 664 

Kent State University 

34 056 

Miami University 

17 161 

Ohio State University 

59 091 

Ohio University 

20 437 

Shawnee State University 

4 300 

University of Toledo 

20 775 

Wright State University 

18 786 

Youngstown State University 

14 682 


32. Consulte el ejercicio 79, capítulo 3. El programa espacial Apolo duró de 1967 a 1972, y compren- 
dió 13 misiones. Éstas duraron tan poco como 7 horas y tanto como 301 horas. La duración de 
los vuelos se reporta a continuación. Bajo el supuesto de que ésta es la información muestral, ¿es 
razonable concluir que estos tiempos de vuelo siguen una distribución normal? Utilice un softwa- 
re estadístico y un nivel de significancia de 0.05. r m 


9 195 241 301 216 260 7 244 192 147 10 295 142 


33 . 


Una encuesta del USA Today investiga la actitud pública hacia la deuda federal. Cada ciudadano 
encuestado se clasificó según su opinión de que el gobierno debería reducir el déficit, aumentar- 
lo o sin opinión. Los resultados de la muestra del estudio por género se reportan en seguida. m 



Reducir el 

Aumentar 

Sin 

Género 

déficit 

el déficit 

opinión 

Masculino 

244 

194 

68 

Femenino 

305 

114 

25 
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A un nivel de significancia de 0.05, ¿es razonable concluir que el género es independiente de la 
posición de una persona con respecto al déficit? 

34 . Un estudio acerca de la relación entre la edad y la cantidad de presión que siente el personal de 
ventas en su trabajo reveló la siguiente información de una muestra. Con un nivel de significancia 
de 0.01 , ¿hay alguna relación entre la presión en el trabajo y la edad? 


Edad (años) 

Grado de presión en el trabajo 

Bajo 

Medio 

Alto 

Menores de 25 

20 

18 

22 

25 a 40 

50 

46 

44 

40 a 60 

58 

63 

59 

60 y mayores 

34 

43 

43 


35 . El departamento de reclamaciones de la Wise Insurance Company cree que los conductores jóve- 
nes tienen más accidentes, por lo cual se les deben cobrar primas mayores. Una muestra de 1 200 
asegurados por Wise reveló el siguiente análisis acerca de las reclamaciones en los últimos tres 
años y la edad del asegurado. ¿Es razonable concluir que hay una relación entre la edad del ase- 
gurado y si hizo una reclamación o no? Utilice el nivel de significancia 0.05. ^ A 


Grupo de edad 

Sin reclamación 

Reclamación 

16 a 25 

170 

74 

25 a 40 

240 

58 

40 a 55 

400 

44 

55 y mayores 

190 

24 

Total 

1 000 

200 


36 . A una muestra de empleados de una gran planta química se le pidió que indicara su preferencia 
por uno de tres planes de pensión. Los resultados aparecen en la siguiente tabla. ¿Parece haber 
una relación entre el plan de pensión seleccionado y la clasificación del trabajo de los empleados? 
Utilice el nivel de significancia 0.01. m 


Plan de 

Clase de trabajo 

pensión 

Plan A 

Plan B 

Plan C 

Supervisor 

10 

13 

29 

De oficina 

19 

80 

19 

Obrero 

81 

57 

22 


37 . ¿Alguna vez compró una bolsa de chocolates M&M’s y se preguntó acerca de la distribución de 
los colores? Visite el sitio web www.baking.m-ms.com y en el mapa haga clic en United States, 
luego en About M&M's, después en History of M&M’s Brand, Product Information, y Peanut, y 
encuentre el análisis del porcentaje de acuerdo con el fabricante, así como una historia breve del 
producto. ¿Sabía que al inicio todos los chocolates eran color marrón? En el caso de los M&M’s 
de cacahuate, 12% es color marrón, 15% amarillo, 12% rojo, 23% azul, 23% naranja y 15% verde. 
Una bolsa de 6 onzas comprada en la Book Store en Coastal Carolina University el 1 de noviem- 
bre de 2008 tenía 12 chocolates color azul, 14 marrón, 13 amarillo, 14 rojo, 7 naranja y 12 verde. 


Ejercicios de la base de datos 
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¿Es razonable concluir que la distribución actual concuerda con la distribución esperada? Utilice 
el nivel de significancia 0.05. Realice su propia prueba. Informe al maestro sus resultados. 



Ejercicios de lo base de datos 

38 . Consulte los datos de bienes raíces que proporcionan información sobre las casas vendidas en el 

área de Goodyear, Arizona, el año pasado. 

a) Seleccione la variable “precio de venta” y utilice el método gráfico para determinar si la supo- 
sición de que los precios siguen una distribución normal es razonable. Utilice un nivel de signi- 
ficancia de 0.05. 

ib) Elabore una tabla de contingencia que muestre si una casa tiene alberca y si aparece el pobla- 
do de su ubicación. ¿Hay alguna asociación entre las variables “alberca” y “poblado”? Utilice 
el nivel de significancia 0.05. 

c) Elabore una tabla de contingencia que muestre si una casa tiene garaje y el poblado de su ubi- 
cación. ¿Hay alguna asociación entre las variables “garaje” y “poblado"? Utilice el nivel de sig- 
nificancia 0.05. 

39 . Consulte los datos de Baseball 2009, con información sobre los 30 equipos de la Liga Mayor de 

Béisbol de Estados Unidos en la temporada 2009. 

a) Establezca una variable que divida los equipos en dos grupos: los que tuvieron una tempora- 
da ganadora y los que no. La temporada se compone de 162 juegos; por lo tanto, defina una 
temporada ganadora con 81 juegos o más. Luego, divida los equipos en dos grupos de sala- 
rios. Coloque los 15 equipos con los salarios mayores en un grupo y los otros 15 equipos con 
los salarios menores en el otro. Con un nivel de significancia de 0.05, ¿hay una relación en- 
tre los salarios y los juegos ganados? 

ib) Utilice un programa de software estadístico para determinar si las variables “salario” y “asisten- 
cia” siguen una distribución normal. Utilice un nivel de significancia de 0.05. 

40 . Consulte los datos de los autobuses del Distrito Escolar Buena. 

a) Encuentre el costo mediano de mantenimiento y la edad mediana de los autobuses. Organice 
los datos en una tabla de contingencia dos a dos, con los autobuses por encima y por debajo 
de la mediana de cada variable. Determine si la edad del autobús se relaciona con el costo de 
mantenimiento. Utilice un nivel de significancia de 0.05. 

ib) ¿Existe una relación entre el costo de mantenimiento y el fabricante del autobús? Utilice el des- 
glose del inciso a) de los autobuses por encima y por debajo del costo mediano de manteni- 
miento y los fabricantes de los autobuses para crear una tabla de contingencia, con un nivel de 
significancia de 0.05. 

c) Utilice un software estadístico y un nivel de significancia de 0.05 para determinar si es razona- 
ble suponer que las distribuciones de edad de los autobuses, el costo de mantenimiento y las 
millas recorridas el mes pasado siguen una distribución normal. 
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Comandos de software 

1 . Los comandos en MegaStat para elaborar la prueba de bon- 
dad de ajuste de ji cuadrada de la página 652 son: 

a) Escriba la información de la tabla 17-2 en una hoja de 
cálculo, como se muestra. 

Jb) Seleccione MegaStat, Chi-Square/Crosstabs y Good- 
ness of Fit Test, y oprima Enter. 
c) En el cuadro de diálogo seleccione B2:B5 como los 
Observed valúes, C2.C5 como los Expected valúes y 
escriba 0 como el Number of parameters estimated 
from the data. Haga clic en OK. 

2 . Los comandos en MegaStat para elaborar las pruebas de 
bondad de ajuste de ji cuadrada de las páginas 657 y 658 
son los mismos excepto por el número de artículos en las 
columnas de frecuencia observada y esperada. Sólo se 
muestra un cuadro de diálogo. 

a) Escriba la información sobre los niveles de administra- 
ción de la página 658. 

b) Seleccione MegaStat, Chi-Square/Crosstabs y Good- 
ness of Fit Test, y oprima Enter. 

c) En el cuadro de diálogo seleccione B2:B7 como los 
Observed valúes, C2.C7 como los Expected valúes y 
escriba 0 como el Number of parameters estimated 
from the data. Haga clic en OK. 

3 . Los comandos de Minitab para la prueba de normalidad de 
la página 663 son: 

a) Ingrese los datos del Applewood Auto Group, 
ib) Seleccione Stat, Basic Statistics y Normality Test, 
c) Seleccione la variable Profit, seleccione None para Per- 
centile Lines, y seleccione Anderson-Darling como 
the Test for Normality. 


4 . Los comandos en Minitab para el análisis de ji cuadrada de 
la página 670 son: 

a) Escriba los nombres de las variables en la primera 
columna y los datos en las siguientes dos columnas. 

b) Seleccione Stat, Table y luego haga clic en Chi-Square 
Test, y oprima Enter. 

c) En el cuadro de diálogo seleccione las columnas 
Outstanding a Unsatisfactory y haga clic en OK. 
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Capítulo 17 


Respuestas a las autoevaluaciones 



17-1 a) Frecuencias observadas. 

b) Seis (seis días de la semana). 

c) 10. Total de las frecuencias observadas 6 = 

60/6 = 10. 

cf) 5; /c— 1=6 — 1=5. 

e) 15.086 (de la tabla ji cuadrada en el apéndice B.3). 

f) 


x 2 = s 


ffo - fe ) 2 


(12 - 10) 2 
10 


(9 - 10) 2 
10 


0.8 


g) No se rechaza H 0 . 

h) El absentismo se distribuye de manera uniforme 
durante la semana. Las diferencias observadas se 
deben a la variación en el muestreo. 

17-2 H 0 : P c = .60, P L = .30 y P u = .10. 

Hp La distribución no es como la anterior. 

Se rechaza H 0 si x 2 > 5.991 . 


17-3 El valor p es 0.865 y no hay grandes diferencias entre la 
recta verde normal y los puntos que representan los 
datos. No rechace la hipótesis nula de que la distribución 
es normal. 

17-4 a) Tabla de contingencia 

b) H 0 \ No hay relación entre el ingreso y jugar a la lotería. 
Hp Flay relación entre el ingreso y jugar a la lotería. 

c) Se rechaza H 0 si x 2 es mayor que 5.991 . 

d) 

2 _ (46 - 40. 71) 2 (28 - 27. 14) 2 (21 - 27. 14) 2 

X ~ 40.71 + 27.14 + 27.14 

(14 - 19.29) 2 (12 — 12.86) 2 (19 12.86) 2 

19.29 + 12.86 + 12.86 

= 6.544 

e) Se rechaza H 0 . Flay relación entre el nivel de ingreso y 
jugar a la lotería. 


Categoría 

fo 

fe 

CM 

3 

i ° 

Actuales 

320 

300 

1.33 

Atrasadas 

120 

150 

6.00 

Irrecuperables 

60 

50 

2.00 


500 

500 

9.33 


Se rechaza H 0 . Los datos de las cuentas por cobrar no 
reflejan el promedio nacional. 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



r 

Métodos no 
paramétricos: 


0A1 Definir una prueba no 
paramétrica y saber cuándo se 
ha aplicado una. 

0A2 Realizar la prueba de los 
signos de muestras 
dependientes con las 
distribuciones binomial y 
normal estándar como 
estadísticos de prueba. 

0A3 Realizar una prueba de 
hipótesis de muestras 
dependientes mediante la 
prueba de los rangos con 
signo de Wilcoxon. 

0A4 Realizar e interpretar la 
prueba de la suma de los 
rangos de Wilcoxon de 
muestras independientes. 

0A5 Realizar e interpretar la 
prueba de Kruskal-Wallis de 
varias muestras 
independientes. 


análisis de datos ordenados 



0A6 Calcular e interpretar el 
coeficiente de correlación de 
los rangos de Spearman. 

OA7 Realizar una prueba de 
hipótesis para determinar si la 
correlación entre los rangos de 
la población es diferente de 
cero. 


Los obreros de Coastal Computer Inc., ensamblan uno o dos montajes 
parciales y los insertan en un chasis. Los ejecutivos de CC piensan 
que los empleados estarían más orgullosos de su trabajo si 
ensamblaran todos los componentes y probaran la computadora 
terminada. Se seleccionó una muestra de 25 empleados para probar la 
¡dea. A 20 les gustó ensamblar toda la unidad y probarla. A un nivel de 
significancia de .05, ¿es posible concluir que los empleados prefirieron 
ensamblar toda la unidad y probarla? (Vea ejercicio 8, objetivo 2.) 


18.2 Prueba de los signos 
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18.1 Introducción 

En el capítulo 17 se introdujeron las pruebas de hipótesis de variables en escala nominal. 
Recuerde, del capítulo 1, que un nivel de medición nominal implica que los datos sólo se cla- 
sifican en categorías, y éstas no reconocen un orden particular. El propósito de estas pruebas 
es determinar si un conjunto de frecuencias observadas, f Q , tiene una diferencia significativa 
con un conjunto correspondiente de frecuencias esperadas, f e . De igual forma, si le interesa la 
relación entre dos características, como la edad de un individuo o su preferencia musical, 
deberá ordenar los datos en una tabla de contingencia y utilizar // cuadrada como el estadís- 
tico de prueba. En estos dos tipos de problemas no es necesario hacer suposiciones acerca 
de la forma de la población. Por ejemplo, no necesita suponer que la población de interés 
sigue la distribución normal, como lo hizo con las pruebas de hipótesis en los capítulos 10 a 
12 . 

OA1 Definir una prueba no Este capítulo es una continuación de la prueba de hipótesis diseñada en especial para 

paramétrica y saber cuándo datos no paramétricos. Para realizar estas pruebas no necesita hacer ninguna suposición 
se ha aplicado una. acerca de la distribución de la población. En ocasiones, se usa el término pruebas libres de 

distribución. Además, no requieren que las respuestas estén clasificadas u ordenadas, así que 
deben ser medidas con una escala ordinal, de intervalo o de razón. Un ejemplo de clasifica- 
ción es el título de ejecutivo. Los ejecutivos corporativos se clasifican como asistente de la 
vicepresidencia, vicepresidente, vicepresidente sénior y presidente. Un vicepresidente se cla- 
sifica más alto que su asistente, un vicepresidente sénior se clasifica más alto que un vicepre- 
sidente, etcétera. 

En este capítulo se consideran cinco pruebas sin distribución y coeficiente de correlación 
de los rangos de Spearman. Las pruebas son: de signo, de la mediana, de los rangos con 
signo de Wilcoxon, de la suma de los rangos de Wilcoxon y el análisis de la varianza por ran- 
gos de Kruskal-Wallis. 


OA2 Realizar la prueba de 
los signos de muestras 
dependientes con las 
distribuciones binomial y 
normal estándar como 
estadísticos de prueba. 


18.2 Prueba de los signos 



La prueba de los signos se basa en el signo de una diferencia entre dos observaciones rela- 
cionadas. En general, se designa con un signo más (+) una diferencia positiva, y con un signo 
menos (— ), una negativa. Por ejemplo, una dietista quiere ver si disminuirá el nivel de coleste- 
rol de una persona si la dieta se complementa con cierto mineral. Ella selecciona una muestra 
de 20 obreros mayores de 40 años de edad y mide su nivel de colesterol. Después que los 20 
sujetos toman el mineral durante 6 semanas, vuelve a medir su nivel de colesterol; si disminu- 
yó, se registra un signo “+”. Si aumentó, se registra un signo Si no hay cambio, se regis- 
tra cero (y esa persona sale del estudio). En el caso de una prueba de los signos, no interesa 
la magnitud de la diferencia, sino sólo la dirección de ella. 

La prueba de los signos tiene muchas aplicaciones. Una es para 
experimentos de “antes/después”. Para ilustrar este punto, suponga la 
evaluación de un programa nuevo de afinación de automóviles. Se regis- 
tra el número de millas recorridas por galón de gasolina antes de la afi- 
nación y de nuevo después de ésta. Si la afinación no es eficaz, es decir, 
si no tuvo efecto en el desempeño, casi la mitad de los automóviles pro- 
bados presentará una disminución de las millas por galón, y la otra 
mitad, un aumento. Se asigna “+” a un aumento y ” a una disminu- 
ción. 

Un experimento sobre la preferencia de un producto ilustra otro uso 
de la prueba del signo. Taster’s Choice vende dos clases de café en un 
frasco de 4 onzas: descafeinado y normal. Su departamento de investi- 
gación de mercado quiere determinar si los bebedores de café prefieren 
descafeinado o normal, y para saberlo les dan dos tazas de café sin nin- 
guna marca y a cada uno se le pregunta cuál prefiere. La preferencia por 
café descafeinado se codifica “ + ”, y la preferencia por el regular, 
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En cierto sentido, los datos están en un nivel ordinal debido a que los bebedores de café le 
dan a su bebida preferida un rango más alto, mientras que el otro tipo de café queda en un 
rango más bajo. Aquí, una vez más, si la población de consumidores de café no tiene una pre- 
ferencia, se debe esperar que la mitad de la muestra de consumidores prefiera café descafei- 
nado, y la otra mitad, normal. 

Un ejemplo ayudará a mostrar mejor la aplicación de la prueba de los signos. A continua- 
ción se presenta un experimento de “antes/después”. 


Cjemplo 


Solución 


El director de sistemas de información de Samuelson Chemicals recomendó implementar un 
programa de capacitación para gerentes en la planta. El objetivo es aumentar los conocimien- 
tos de computación en los departamentos de nómina, contabilidad y producción. 

Se seleccionó de forma aleatoria una muestra de 15 gerentes de los tres departamentos. 
Un panel de expertos clasificó a cada uno de acuerdo con sus conocimientos en computación. 
Se calificaron como sobresalientes, excelentes, buenos, regulares o deficientes. (Consulte la 
tabla 18-1.) Después del programa de capacitación de tres meses, el mismo panel de exper- 
tos en sistemas de información calificó a cada gerente una vez más. Las dos calificaciones 
(antes y después) aparecen con el signo de la diferencia. Un signo “ + ” indica una mejora, y un 
signo que la competencia del gerente con las bases de datos declinó después del pro- 
grama de capacitación. 

TABLA 1 8-1 Nivel de competencia antes y después del programa de capacitación 


Nombre 


Antes 


Después 


Signo de la diferencia 


T.J. Bowers 
Sue Jenkins 


Buena 

Regular 


Extraordinaria 

Excelente 



James Brown 

Excelente 

Buena 

- 

Eliminado 

del 

Tad Jackson 

Deficiente 

Buena 

+ 

Andy Love 

Excelente 

Excelente 

0 

análisis 

Sarah Truett 

Buena 

Extraordinaria 

+ 


Antonia Aillo 

Deficiente 

Regular 

+ 


Jean Unger 

Excelente 

Extraordinaria 

+ 


Coy Farmer 

Buena 

Deficiente 

- 


Troy Archer 

Deficiente 

Buena 

+ 


V. A. Jones 

Buena 

Extraordinaria 

+ 


Juan Guillen 

Regular 

Excelente 

+ 


Candy Fry 

Buena 

Regular 

- 


Arthur Seiple 

Buena 

Extraordinaria 

+ 


Sandy Gumpp 

Deficiente 

Buena 

+ 


Lo que interesa saber es si el programa de capacitación en la planta aumentó la eficacia 
de los gerentes en el uso de la base de datos de la compañía. Es decir, ¿los gerentes son más 
competentes después del programa de capacitación que antes? 

Utilice el procedimiento de prueba de hipótesis de cinco pasos. 

Paso 1: Formule las hipótesis nula y alternativa. 

H 0 \ tt < .50 No hay aumento del conocimiento en el uso de las bases 
de datos como resultado del programa de capacitación en la 
planta. 

H-¡: tt > .50 Existe un aumento del conocimiento en el uso de las bases de 
datos de los gerente después del programa de capacitación. 
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Estadística en acción 

Una investigación recien- 
te aplicada a estudiantes 
universitarios de la 
University of Michigan 
reveló que los alumnos 
con los peores registros 
de asistencia suelen obte- 
ner las calificaciones más 
bajas. ¿Le sorprende? Los 
estudiantes que se ausen- 
tan menos de 10% del 
tiempo suelen obtener 
una calificación de 9 o 
mejor. El mismo estudio 
determinó que los estu- 
diantes que se sientan al 
frente de la clase obtie- 
nen calificaciones mayo- 
res que quienes se 
sientan en la parte poste- 



El símbolo tt es la proporción de la población con una característica particu- 
lar. Si no se rechaza la hipótesis nula, se indica que el programa de capacitación 
no produjo ningún cambio en el nivel de competencia o que la competencia en 
realidad disminuyó. Si se rechaza la hipótesis nula, se indica que la competencia 
de los gerentes aumentó como resultado del programa de capacitación. 

El estadístico de prueba sigue la distribución de probabilidad binomial. Es 
apropiado debido a que la prueba de los signos cumple con todas las suposicio- 
nes binomiales, que son las siguientes: 

1. Sólo hay dos resultados: “éxito” o “fracaso”. Un gerente o aumentó sus 
conocimientos (éxito) o no. 

2. Por cada intento, se supone que la probabilidad de éxito es 0.50. Así, la pro- 
babilidad de un éxito es la misma en todos los intentos (en este caso, los 
gerentes). 

3. El número total de intentos es fijo (1 5 en este experimento). 

4. Cada intento es independiente. Eso significa, por ejemplo, que el desempe- 
ño de Arthur Seiple en el curso de tres meses no se relaciona con el desem- 
peño de Sandy Gumpp. 

Paso 2: Seleccione un nivel de significancia. Elija un nivel de 0.10. 

Paso 3: Decida sobre el estadístico de prueba. Es el número de signos más que resul- 
ten del experimento. 

Paso 4: Formule una regla de decisión. En el curso de capacitación se inscribieron 15 
gerentes, pero el nivel de conocimientos de Andy Love no mostró aumento ni 
reducción. (Consulte la tabla 18-1.) Por lo tanto, se eliminó del estudio debido a 
que no se pudo incluir en ningún grupo, entonces n = 14. A partir de la tabla de 
distribución de probabilidad binomial del apéndice B.9, para una n de 14 y una 
probabilidad de 0.50, se presenta la distribución de probabilidad binomial en la 
tabla 18-2. El número de éxitos aparece en la columna 1, las probabilidades de 
éxito en la columna 2, y las probabilidades acumuladas en la 3. Para llegar a las 
probabilidades acumuladas, sume las probabilidades de éxito de la columna 2 
desde la parte inferior. Con fines de ilustración, para obtener la probabilidad acu- 
mulada de 11 o más éxitos, sume 0.000 + 0.001 + 0.006 + 0.022 = 0.029. 

Ésta es una prueba de una cola debido a que la hipótesis alternativa propor- 
ciona una dirección. La desigualdad (>) apunta hacia la derecha. Por lo tanto, la 
región de rechazo está en la cola superior o derecha. Si el signo de desigualdad 
apuntara hacia la cola izquierda (<), la región de rechazo estaría en la cola infe- 
rior o izquierda. Si ése fuera el caso, sumaría las probabilidades de la columna 2 
hacia abajo para obtener las probabilidades acumuladas en la columna 3. 

Recuerde que se seleccionó el nivel de significancia de 0.10. Para llegar a la 
regla de decisión para este problema, se recurre a las probabilidades acumula- 
das en la tabla 1 8-2, columna 3. Se lee de abajo hacia arriba hasta llegar a la pro- 
babilidad acumulada más cercana, pero sin exceder el nivel de significancia 
(0.10). Esa probabilidad acumulada es 0.090. El número de éxitos (signos más) 
que corresponde a 0.090 en la columna 1 es 1 0. Por lo tanto, la regla de decisión 
es: si el número de signos más en la muestra es 10 o mayor, se rechaza la hipó- 
tesis nula y se acepta la hipótesis alternativa. 

Para repasar: se suman las probabilidades de abajo hacia arriba porque la 
dirección de la desigualdad (>) es hacia la derecha, lo que indica que la región 
de rechazo está en la cola superior. Si el número de signos más en la muestra es 
10 o mayor, se rechaza la hipótesis nula; de lo contrario, no se rechaza H 0 . La 
representación de la región de rechazo aparece en la gráfica 18-1. 

¿Qué procedimiento se sigue en el caso de una prueba de dos colas? Se com- 
binan (suman) las probabilidades de éxito en las dos colas hasta estar lo más 
cerca posible del nivel de significancia deseado (a) sin sobrepasarlo. En este 
ejemplo, a es 0.10. La probabilidad de 3 o menos éxitos es 0.029, determinada 
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TABLA 18-2 Distribución de probabilidad binomial para n = 14, ir = 0.50 


(1) 

Número 
de éxitos 

(2) 

Probabilidad 
de éxito 

(3) 

Probabilidad 

acumulada 


0 

.000 

1.000 


1 

.001 

.999 


2 

.006 

.998 


3 

.022 

.992 


4 

.061 

.970 


5 

.122 

.909 


6 

.183 

.787 


7 

.209 

.604 


8 

.183 

.395 


9 

.122 

.212 


10 

.061 

.090 


11 

.022 

.029 * 

.000 + .001 + 

12 

.006 

.007 

.006 + .022 

13 

.001 Suma hacia arriba .001 


14 

.000 

.000 




GRÁFICA 18-1 Distribución binomial, n = 14, ir = 0.50 


mediante 0.000 + 0.001 + 0.006 + 0.022. La probabilidad de 11 o más éxitos 
también es 0.029. Si suma las dos probabilidades, 0.029 + 0.029, se obtiene 
0.058. Esto es lo más cercano que se puede estar de 0.10 sin sobrepasarlo. Si 
hubiera incluido las probabilidades de 4 y 10 éxitos, 0.090 + 0.090, el total sería 
0.180, que excede 0.10. Por lo tanto, la regla de decisión en el caso de una prue- 
ba de dos colas sería rechazar la hipótesis nula si hay 3 o menos signos más, u 
11o más signos más. 

Paso 5: Tome una decisión respecto de la hipótesis nula. Once de los 14 gerentes en 
el curso de capacitación aumentaron su competencia para las bases de datos. El 
número 11 está en la región de rechazo, que inicia en 10, por lo tanto, se recha- 
za H 0 . Conclusión: el curso de capacitación de tres meses fue eficaz; incrementa 
la competencia de los gerentes. 
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Debe hacerse notar otra vez que si la hipóte- 
sis nula no ofrece una dirección, por ejemplo, H 0 \ 
jt = 0.50 y ir *■ 0.50, la prueba de hipótesis es 
de dos colas. En esos casos hay dos regiones de 
rechazo, una en la cola inferior y la otra en la cola 
superior. Si a = 0.10 y la prueba es de dos colas, 
el área en cada cola es 0.05 (a/2 = 0.10/2 = 0.05). 
La autoevaluación 18-1 ilustra lo anterior. 



Recuerde el ejemplo de Taster’s Choice descrito en la página 681 , de una prueba entre consumido- 
res para determinar su preferencia por el café descafeinado en comparación con el normal. Las 
hipótesis nula y alternativa son: 


H 0 : tt = .50 n = 12 
H,: tt 4 .50 

a) ¿Se trata de una hipótesis de prueba de una o dos colas? 

b ) Ilustre la regla de decisión en una gráfica. 

c) Al designar la preferencia del consumidor por café descafeinado como “+” y por café normal 
como se determinó que dos consumidores prefirieron café descafeinado. ¿Cuál es su deci- 
sión? Explique su respuesta. 


comect 


Ejercicios 

1. Se da la siguiente situación de prueba de hipótesis: H 0 \ tt < 0.50 y tt > 0.50. El nivel de sig- 
nificancia es 0.10, y el tamaño de la muestra es 12. 

a) ¿Cuál es su regla de decisión? 

b) Hubo nueve éxitos. ¿Cuál es su decisión respecto de la hipótesis nula? Explique su respues- 
ta. 

2. Se da la siguiente situación de prueba de hipótesis: H 0 \ tt = 0.50 y Hy tt* 0.50. El nivel de signi- 
ficancia es 0.05, y el tamaño de la muestra es 9. 

a) ¿Cuál es su regla de decisión? 

b) Hubo cinco éxitos. ¿Cuál es su decisión respecto de la hipótesis nula? 

3. Calorie Watchers tiene desayunos, comidas y cenas bajas en calorías. Si usted se une al club, reci- 
be dos alimentos empacados al día. Calorie Watchers afirma que usted puede comer todo lo que 
quiera en su tercera comida y aun así perderá al menos cinco libras el primer mes. Los miembros 
del club se pesan antes de comenzar el programa y de nuevo al cabo del primer mes. Las expe- 
riencias de una muestra aleatoria de 1 1 miembros son: 


Nombre 

Cambio de peso 

Nombre 

Cambio de peso 

Foster 

Bajó 

Hercher 

Bajó 

Taoka 

Bajó 

Camder 

Bajó 

Lange 

Subió 

Hinckle 

Bajó 

Rousos 

Bajó 

Hinkley 

Bajó 

Stephens 

Sin cambio 

Justin 

Bajó 

Cantrell 

Bajó 




Lo que interesa saber es si los miembros perdieron peso como resultado del programa de Calorie 
Watchers. 

a) Formule H 0 y H 1 . 

b) Con un nivel de significancia de 0.05, ¿cuál es su regla de decisión? 

c) ¿Cuál es su conclusión respecto del programa de Calorie Watchers? 
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4. Muchos corredores de bolsa nuevos no se atreven a realizar presentaciones frente a banqueros y 
otros grupos. Al detectar esta falta de autoestima, la gerencia organizó un seminario de motiva- 
ción para una muestra de corredores de bolsa nuevos y contrató a Career Boosters para que diera 
un curso de tres semanas. Antes de la primera sesión, Career Boosters midió el nivel de autoesti- 
ma de cada participante, y lo midió de nuevo después del seminario de tres semanas. Los niveles 
de autoestima antes y después de los 14 participantes en el curso aparecen en la siguiente tabla. 
La autoestima se clasificó como negativa, baja, alta o muy alta. 


Corredor Antes del Después 

de bolsa seminario del seminario 


J.M. Martin 

Negativa 

Baja 

T.D. Jagger 

Negativa 

Negativa 

A.D. Hammer 

Baja 

Alta 

T.A. Jones, Jr. 

Muy alta 

Baja 

B.G. Dlngh 

Baja 

Alta 

D.A. Skeen 

Baja 

Alta 

C.B. Simmer 

Negativa 

Alta 


Corredor Antes del Después 

de bolsa seminario del seminario 


F.M. Orphey 

Baja 

Muy alta 

C.C. Ford 

Baja 

Alta 

A.R. Utz 

Negativa 

Baja 

M.R. Murphy 

Baja 

Alta 

P.A. López 

Negativa 

Baja 

B.K. Pierre 

Baja 

Alta 

N.S. Walker 

Baja 

Muy alta 


El propósito del estudio es determinar si Career Boosters fue eficaz para aumentar la autoesti- 
ma de los corredores de bolsa nuevos. Es decir, ¿el nivel de autoestima fue más alto después del 
seminario que antes? Utilice un nivel de significancia de 0.05. 

a) Formule las hipótesis nula y alternativa. 

b) Con un nivel de significancia de 0.05, indique la regla de decisión, ya sea en palabras o en 
forma gráfica. 

c) Apunte sus conclusiones acerca del seminario ofrecido por Career Boosters. 

Uso de la aproximación normal a la binomial 

Si el número de observaciones en la muestra es mayor que 10, puede utilizar la distribu- 
ción normal para aproximar la binomial. Recuerde que en la sección 6.5 del capítulo 6 calcu- 
ló la media de la distribución normal a partir de p = mr y la desviación estándar de 
o- = VnTr(1 - tt). En este caso, tt = 0.50, por lo que puede reducir las ecuaciones a p = .50 n 
y o- = .50 Vn, respectivamente. 

El estadístico de prueba z es: 


PRUEBA DE LOS SIGNOS, n > 10 


z = 


(X ± .50) - |x 


(18-1) 


Si el número de signos “+” más o ” menos es mayor que n/2, emplee la siguiente fórmula 
como estadístico de prueba: 


PRUEBA DE LOS SIGNOS, n > 10, 
SIGNOS + MAYORES QUE ni 2 


(X - .50) - |x _ (X - .50) - ,50n 
ct ,50\/ñ 


(18-2) 




Si el número de signos “ + ” más o menos es menor que n/2 , el estadístico de prueba z 
es: 


PRUEBA DE LOS SIGNOS, n > 10, 
SIGNOS + MENORES QUE n/2 


z = 


(X + .50) - |x _ (X + ,50) - ,50n 
(t .50 Vn 


(18-3) 


En las fórmulas anteriores, X es el número de signos más o menos. El valor +0.50 o bien —0.50 
es el factor de corrección de continuidad, que se estudió en la sección 7.5 del capítulo 7. En 
resumen, se aplica cuando una distribución continua como la normal (que se está utilizando) 
sirve para aproximar una distribución discreta (la binomial). 

El siguiente ejemplo ilustra los detalles de la prueba del signo cuando n es mayor que 10. 
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Cjemplo 


Solución 


El departamento de investigación de mercado de Cola, Inc., tiene la tarea de probar una nueva 
bebida. Se consideran dos versiones: un refresco más bien dulce y uno un tanto amargo. La 
prueba de preferencia que se realizará consiste en una muestra de 64 consumidores. Cada uno 
de éstos degustará las dos bebidas de cola, la dulce (con la etiqueta A) y la amarga (con la eti- 
queta B), e indicará su preferencia. Realice una prueba de hipótesis para determinar si hay una 
diferencia entre las preferencias por el refresco dulce o por el amargo. Utilice un nivel de sig- 
nificancia de 0.05. 

Paso 1: Formule las hipótesis nula y alternativa. 

H 0 : ir = .50 No hay preferencia. 

+ .50 Sí hay preferencia. 

Paso 2: Seleccione un nivel de significancia. Es de 0.05, indicado en el problema. 
Paso 3: Seleccione el estadístico de prueba. Es z, dado en la fórmula (18-1). 

(* ± -50) - ix 

a 

donde |jl = 0.50/1 y ct = ,50Vñ. 

Paso 4: Formule la regla de decisión. En el apéndice B.1 , “Áreas debajo de la curva nor- 
mal”, para una prueba de dos colas (debido a que estipula que ir # 0.50) y el 
nivel de significancia de 0.05, los valores críticos son +1.96 y -1.96. Recuerde 
del capítulo 10 que, en una prueba de dos colas, se divide la probabilidad de 
rechazo a la mitad y se coloca una mitad en cada cola. Es decir, a/2 = 0.05/2 = 
0.025; lo que sigue es 0.5000 - 0.0250 = 0.4750. Al buscar 0.4750 en el cuerpo 
de la tabla y leer el valor z en el margen izquierdo obtiene 1.96, el valor crítico. 
Por lo tanto, no rechace H 0 si el valor z calculado se encuentra entre -1.96 y 
+ 1.96. De lo contrario, rechace H 0 y acepte 

Paso 5: Calcule z, compare el valor calculado con el valor crítico y tome una deci- 
sión respecto de H 0 . A la preferencia por el refresco A se le asignó un signo “ + ”, 
y a la preferencia por el B, un signo De las 64 personas de la muestra, 42 
prefirieron el sabor dulce, que es el refresco A. Por lo tanto, hay 42 signos más. 
Como 42 es mayor que n/2 = 64/2 = 32, emplee la fórmula (18-2) de z: 

(X - .50) - ,50n (42 - .50) - .50(64) 

.50 Vn .50V64 

El valor z calculado de 2.38 es mayor que el valor crítico de 1.96. En consecuen- 
cia, se debe rechazar la hipótesis nula de que no hay diferencia con un nivel de 
significancia de 0.05. Conclusión: los consumidores prefieren el refresco de cola 
dulce al otro. 

El valor p es la probabilidad de encontrar un valor z mayor que 2.38 o menor 
que -2.38. Del apéndice B.1, la probabilidad de encontrar un valor z mayor que 
2.38 es 0.5000 - 0.4913 = 0.0087. Así, el valor p de dos colas es 0.0174, resul- 
tado de 2(0.0087). Por lo tanto, la probabilidad de obtener un estadístico de la 
muestra tan extremo cuando la hipótesis nula es verdadera es menor que 2%. 


Autoevaluación 18-2 El departamento de recursos humanos de Ford Motor Company implantó un programa de medición 
de la presión arterial y educación sobre cómo mantenerla dentro de ciertos límites para los 100 
empleados del departamento de pintura el primer día del año. Como seguimiento, en julio se les 
tomó la presión arterial a los mismos 100 empleados, y 80 de ellos mostraron una reducción. ¿Es 
posible concluir que las mediciones fueron eficaces para reducir la presión arterial? 

a) Formule las hipótesis nula y alternativa. 

b) ¿Cuál es la regla de decisión con un nivel de significancia de 0.05? 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

e) Interprete su decisión. 
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comed 


Ejercicios 

5 . Una muestra de 45 hombres con sobrepeso participó en un programa de ejercicio. Al término del 
programa, el peso de 32 de ellos se redujo. Con un nivel de significancia de 0.05, ¿es posible con- 
cluir que el programa es eficaz? 

a) Formule las hipótesis nula y alternativa. 

b) Formule la regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

6. Una muestra de 60 estudiantes universitarios participó en un programa de capacitación especial 
para mejorar su administración del tiempo. Un mes después de terminar el curso se contactó a los 
estudiantes y se les preguntó si las habilidades adquiridas en el programa fueron eficaces. Un total 
de 42 respondieron que sí. Con un nivel de significancia de 0.05, ¿es posible concluir que el pro- 
grama es eficaz? 

a) Formule las hipótesis nula y alternativa. 

b) Formule su regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d) ¿Cuál es su decisión respecto de la hipótesis nula? 

7 . Pierre’s Restaurant anunció que la noche del jueves el menú consistirá en platillos gourmet poco 
comunes, como calamar, conejo, caracoles de Escocia y hojas de diente de león. Como parte de 
un estudio más extenso, a una muestra de 81 comensales frecuentes se le preguntó si prefieren el 
menú normal o el menú gourmet. De ellos, 43 prefirieron el menú gourmet. Con un nivel de signi- 
ficancia de 0.02, ¿es posible concluir que los comensales prefieren el menú gourmet? 

8. Los trabajadores de Costal Computers ensamblan sólo una o dos piezas de subensamblado y los 
insertan en un chasis. Los ejecutivos de la compañía consideran que los empleados estarían más 
orgullosos de su trabajo si ensamblaran todos los componentes y probaran la computadora com- 
pleta. Se seleccionó una muestra de 25 empleados para experimentar con esta idea. Después de 
un programa de capacitación, a cada uno de los empleados se le preguntó su preferencia. A 20 
les gustó ensamblar la unidad completa. A un nivel de significancia de 0.05, ¿es posible concluir 
que los empleados prefieren ensamblar toda la unidad? Explique los pasos que siguió para llegar 
a su decisión. 


Prueba de hipótesis acerca de una mediana 

La mayoría de las pruebas de hipótesis que se realizaron hasta este punto comprendieron la 
media de la población o una proporción. La prueba de los signos es una de las pocas prue- 
bas con que se demuestra el valor de una mediana. Recuerde, de la sección 3.6 del capítulo 
3, que la mediana es el valor sobre el cual están la mitad de las observaciones y debajo del 
cual encontramos la otra mitad. Para los honorarios por hora de $7, $9, $1 1 y $18, la media- 
na es $10. La mitad de los honorarios están arriba de $10 por hora, y la otra mitad, debajo de 
$10 por hora. 

Para realizar una prueba de hipótesis, a un valor por arriba de la mediana se le da un signo 
más, y a un valor debajo de la mediana, un signo menos. Si un valor es el mismo que la media- 
na, en el análisis posterior se lo elimina. 


Cjemplo 


Solución 


Un estudio realizado hace varios años por el departamento de investigación del consumidor de 
Superior Groceries determinó que la cantidad mediana semanal gastada en abarrotes por 
matrimonios jóvenes era de $123. El director ejecutivo quiere repetir el estudio para determinar 
si dicha cantidad cambió. La información de la nueva muestra del departamento reveló que, en 
una muestra aleatoria de 102 matrimonios jóvenes, 60 gastaron más de $123 la semana pasa- 
da en abarrotes, 40 gastaron menos y 2 gastaron exactamente $123. Con un nivel de signifi- 
cancia de 0.10, ¿es razonable concluir que la nueva mediana no es igual a $123? 

Si la mediana de la población es $123, se espera que casi la mitad de los matrimonios mues- 
treados haya gastado más de $123 la última semana, y que casi toda la otra mitad haya gas- 
tado menos de $123. Después de eliminar a las dos parejas que gastaron exactamente $123, 
se debe esperar que 50 estén arriba de la mediana y 50 por debajo de ella. ¿Es posible atribuir 
esta diferencia a la casualidad, o es la mediana algún valor distinto a $123? La prueba estadís- 
tica de la mediana ayudará a responder esta pregunta. 
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Las hipótesis nula y alternativa son: 

H 0 \ Mediana = $123 
H Mediana # $123 

Ésta es una prueba de dos colas debido a que la hipótesis alternativa no indica una dirección. 
Es decir, no interesa si la mediana es menor o mayor que $123, sólo que es diferente a $123. 
El estadístico de prueba cumple con las suposiciones binomiales. Es decir: 

1 . Una observación es mayor o es menor que la mediana propuesta, por lo que sólo hay dos 
resultados posibles. 

2. La probabilidad de un éxito permanece constante en 0.50. Es decir, v = 0.50. 

3. Los matrimonios seleccionados como parte de la muestra representan intentos indepen- 
dientes. 

4. El número de éxitos se cuenta en un número fijo de intentos. En este caso, se consideran 
100 matrimonios y se cuenta el número de los que gastan más de $123 a la semana. 

El tamaño útil de la muestra es 100, y ir es 0.50, por lo que mr = 100(0.50) = 50 y n(1 - 
ir) = 100(1 - 0.50) = 50, que son mayores que 5, por lo que se utiliza la distribución normal 
para aproximar la binomial. Es decir, en realidad se emplea la distribución normal estándar 
como el estadístico de prueba. El nivel de significancia es 0.10; por lo tanto, a/2 = 0.10/2 = 
0.05 del área se encuentra en cada cola de una distribución normal. Del apéndice B.1, que 
muestra las áreas debajo de una curva normal, los valores críticos son -1.65 y 1.65. La regla 
de decisión es rechazar H 0 si z es menor que - 1 .65 o mayor que 1.65. 

Utilice la fórmula (18-2) para calcular z, debido a que 60 es mayor que ni 2 o (100/2 = 50). 

(X - .50) - ,50n (60 - .5) - .50(100) 

2 " T50Vn " .50 VTÜÜ " 1 - 9 10 ° 

Se rechaza la hipótesis nula debido a que el valor calculado de 1 .90 es mayor que el valor 
crítico de 1.65. La evidencia de la muestra indica que la cantidad mediana gastada por sema- 
na en abarrotes por parejas jóvenes no es $123. El valor p es 0.0574, determinado mediante 
2(0.5000 - 0.4713). El valor p es menor que el nivel de significancia de 0.10 para esta prueba. 



Tras recibir los resultados del departamento de investigación del consumidor respecto de la canti- 
dad semanal gastada en abarrotes por parejas jóvenes, el director ejecutivo de Superior Groceries 
se pregunta si las parejas de adultos mayores muestran la misma conducta. En este caso, el direc- 
tor quiere que el departamento de investigación del consumidor investigue si la cantidad mediana 
semanal que gastan por semana los adultos mayores es mayor que $123. Una muestra de 64 pare- 
jas de adultos mayores reveló que 42% gasta más de $123 por semana en abarrotes. Utilice un 
nivel de significancia de 0.05. 


connect 


Ejercicios 

9. De acuerdo con el U.S. Department of Labor, en Estados Unidos el salario mediano de un quiro- 
práctico es de $81 500 al año. Un grupo de graduados recientes considera que esta cantidad es 
muy baja. En una muestra de 205 quiroprácticos recién graduados, 170 iniciaron con un salario de 
más de $81 500, y cinco ganaban un salario de exactamente $81 500. 

a) Formule las hipótesis nula y alternativa. 

b) Formule la regla de decisión. Utilice un nivel de significancia de .05. 

c) Realice los cálculos necesarios e interprete los resultados. 

10. Central Airlines afirma que la mediana del precio de un boleto de ida y vuelta de Chicago a Jackson 
Fióle, Wyoming, es de $503. La Association of Travel Agents duda de esta afirmación y sostiene 
que la mediana del precio es menor que $503. Una muestra aleatoria de 400 boletos de ida y vuel- 
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ta de Chicago a Jackson Hole reveló que 160 boletos costaban menos de $503. Ninguno de los 
boletos costaba exactamente $503. Sea a = 0.05. 

a) Formule las hipótesis nula y alternativa. 

b ) ¿Cuál es su decisión respecto de H 0 ? Haga un comentario sobre su decisión. 


OA3 Realizar una prueba 
de hipótesis de muestras 
dependientes mediante la 
prueba de los rangos con 
signo de Wilcoxon. 


18.3 Prueba de rangos con signo 

de Wilcoxon para muestras dependientes 

La prueba t por pares (o apareada) (página 392), que se describió en el capítulo 1 1 , tiene dos 
requisitos. Primero, las muestras deben ser dependientes. Recuerde que las muestras depen- 
dientes se caracterizan por una medición, algún tipo de intervención y luego otra medición. 
Por ejemplo, una compañía inició un programa de “bienestar” al inicio del año. Se inscribieron 
20 personas en la parte de reducción de peso del programa. Para comenzar, se pesaron todos 
los participantes. Luego se pusieron a dieta, hicieron ejercicio, etc., para reducir de peso. Al 
final del programa, que duró seis meses, todos los participantes se pesaron de nuevo. La dife- 
rencia entre sus pesos al inicio y al final del programa es la variable de interés. Observe que 
hay una medición, una intervención y luego otra medición. 

El segundo requisito de la prueba t por pares es que la distribución de las diferencias siga 
la distribución normal de probabilidad. En el ejemplo sobre el bienestar de la compañía, esto 

requiere que las diferencias entre los pesos de 
los 20 participantes sigan la distribución normal 
de probabilidad. En ese caso, dicha suposición 
es razonable. Sin embargo, hay casos en que 
interesarán las diferencias entre observaciones 
independientes y no se podrá suponer que la 
distribución de las diferencias se aproxima a 
una distribución normal. Con frecuencia, 
encontrará problemas con la suposición de nor- 
malidad cuando el nivel de medición en las 
muestras sea ordinal, en lugar de intervalo o de 
razón. Por ejemplo, suponga que hoy, en la clí- 
nica 3, hay 10 pacientes en cirugía. La supervi- 
sora de enfermería pide a las enfermeras 
Benner y Jurris que califiquen a cada uno de los pacientes en una escala de 1 a 10 de acuer- 
do con la dificultad de los cuidados que deben recibir. La distribución de las diferencias entre 
las calificaciones quizá no se aproxime a la distribución normal, por lo que no sería adecuada 
la prueba t por pares. 

En 1945, Frank Wilcoxon desarrolló una prueba no paramétrica, con base en las diferen- 
cias entre muestras dependientes, que no requiere la suposición de normalidad. Esta prueba 
se denomina prueba de rangos con signo de Wilcoxon. En el siguiente ejemplo se dan los 
detalles de su aplicación. 



Cjemplo 


Fricker’s es una cadena de restaurantes familiares ubicada sobre todo en el sureste de Estados 
Unidos, que ofrece un menú muy completo, pero su especialidad es el pollo. Hace poco, Bernie 
Frick, propietario y fundador, elaboró un nuevo sabor con especias para la salsa en la que se 
cocina el pollo. Antes de reemplazar el sabor actual, quiere realizar algunas pruebas para estar 
seguro de que a los comensales les gusta más este nuevo sabor. 

Para iniciar, Bernie selecciona una muestra aleatoria de 15 clientes. A cada cliente de la 
muestra le da una pieza de pollo actual y le pide que califique su sabor en una escala de 1 a 
20. Un valor cercano a 20 indica que al participante le gustó el sabor, en tanto que una califi- 
cación cerca de 1 indica que no le gustó el sabor. Luego, a los mismos 15 participantes les da 
una muestra del pollo con el nuevo sabor a especias y una vez más les pide calificar su sabor 
en una escala de 1 a 20. Los resultados aparecen en la siguiente tabla. ¿Es razonable concluir 
que el sabor a especias es el preferido? Utilice un nivel de significancia de .05. 
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Solución 


Participante 

Calificación del 
sabor a especias 

Calificación del 
sabor actual 

Participante 

Calificación del 
sabor a especias 

Calificación del 
sabor actual 

Arquette 

14 

12 

Garda 

19 

10 

Jones 

8 

16 

Sundar 

18 

10 

Fish 

6 

2 

Miller 

16 

13 

Wagner 

18 

4 

Peterson 

18 

2 

Badenhop 

20 

12 

Boggart 

4 

13 

Hall 

16 

16 

Hein 

7 

14 

Fowler 

14 

5 

Whitten 

16 

4 

Virost 

6 

16 





Las muestras son dependientes o están relacionadas. Es decir, a los participantes se les pide 
calificar los dos sabores del pollo. Por lo tanto, si calcula la diferencia entre la calificación 
del sabor a especias y la del sabor actual, el valor resultante muestra que la cantidad de par- 
ticipantes favorecen un sabor en comparación con el otro. Si elige restar la calificación del 
sabor actual a la calificación del sabor a especias, un resultado positivo es la “cantidad” con 
que los participantes prefieren el sabor a especias. Las diferencias negativas de las calificacio- 
nes indican que el participante prefirió el sabor actual. Debido a la naturaleza un tanto subjeti- 
va de las calificaciones, no hay seguridad de que la distribución de las diferencias siga la 
distribución normal, por lo que conviene utilizar la prueba de rangos con signo de Wilcoxon no 
paramétrica. 

Como es habitual, emplee el procedimiento de prueba de hipótesis en cinco pasos. La 
hipótesis nula es que no hay diferencias entre las calificaciones de los sabores del pollo. Es 
decir, la misma cantidad de participantes dio una calificación alta al sabor actual y al sabor a 
especias. La hipótesis alternativa es que las calificaciones son más altas para el sabor a espe- 
cias. De manera más formal: 

H 0 -, No hay diferencia entre las calificaciones de los dos sabores. 

H-¡: Las calificaciones son más altas para el sabor a especias. 

Se trata de una prueba de una cola. ¿Por qué? Porque Bernie Frick, propietario de Fricker’s, 
cambiará el sabor del pollo sólo si los participantes en la muestra indican que a la población 
de clientes le gusta más el nuevo sabor. El nivel de significancia de la prueba es de 0.05, como 
se indicó antes. 

Los pasos para realizar la prueba de rangos con signo de Wilcoxon son los siguientes: 

1 . Calcule la diferencia entre la calificación del sabor a especias y la del sabor actual de cada 
participante. Por ejemplo, la calificación del sabor a especias de Arquette fue de 14, y del 
sabor actual, de 12, por lo que la diferencia es 2. Para Jones, la diferencia es -8, deter- 
minada mediante 8 - 16, y para Fish es 4, determinada por 6-2. Las diferencias de 
todos los participantes aparecen en la columna 4 de la tabla 18-3. 

2. En el análisis posterior sólo se consideran las diferencias positivas y negativas. Es decir, 
si la diferencia entre las calificaciones del sabor es 0, ese participante se elimina de un 
análisis posterior y se reduce el número de integrantes de la muestra. De la tabla 18-3, 
Hall, el sexto participante, calificó al sabor a especias y al actual con 16. Por lo tanto, se 
lo elimina del estudio y se reduce el tamaño útil de la muestra de 15 a 14. 

3. Determine las diferencias absolutas de los valores calculados en la columna 4. Recuerde 
que la diferencia absoluta ignora el signo de la diferencia. Las diferencias absolutas se 
muestran en la columna 5. 

4. Luego, ordene las diferencias absolutas de menor a mayor. Arquette, el primer participan- 
te, calificó al pollo con especias con 14 y al actual con 12. La diferencia de 2 en las dos 
calificaciones del sabor es la diferencia absoluta menor, por lo cual se le asigna un rango 
de 1. La siguiente diferencia mayor es 3, de Miller, por lo que se le asigna un rango de 2. 
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Las otras diferencias se ordenan de manera similar. Hay tres participantes que calificaron 
la diferencia entre los sabores con 8. Es decir, Jones, Badenhop y Sundar tuvieron una 
diferencia de 8 entre la calificación del sabor a especias y la del sabor actual. Para resol- 
ver este problema, promedie estas clasificaciones y anote la clasificación promedio de 
cada uno. Esta situación comprende las clasificaciones de 5, 6 y 7, de modo que a los tres 
participantes se les asigna la clasificación de 6. Es la misma situación de los participantes 
con una diferencia de 9. Las clasificaciones comprendidas son 8, 9 y 10, de manera que 
a estos participantes se les asigna una clasificación de 9. 


TABLA 18-3 Calificación de los sabores actual y de especias 


(1) 

Participante 

(2) 

Calificación del 
sabor a especias 

(3) 

Calificación 

actual 

(4) 

Diferencia entre 
calificaciones 

(5) 

Diferencia 

absoluta 

(6) 

Rango 

(7) 

Rango con signo 
R + R - 

Arquette 

14 

12 

2 

2 

1 

1 

Jones 

8 

16 

-8 

8 

6 

6 

Fish 

6 

2 

4 

4 

3 

3 

Wagner 

18 

4 

14 

14 

13 

13 

Badenhop 

20 

12 

8 

8 

6 

6 

Hall 

16 

16 

★ 

★ 

★ 

★ 

Fowler 

14 

5 

9 

9 

9 

9 

Virost 

6 

16 

-10 

10 

11 

11 

García 

19 

10 

9 

9 

9 

9 

Sundar 

18 

10 

8 

8 

6 

6 

Miller 

16 

13 

3 

3 

2 

2 

Peterson 

18 

2 

16 

16 

14 

14 

Boggart 

4 

13 

-9 

9 

9 

9 

Hein 

7 

14 

—7 

7 

4 

4 

Whitten 

16 

4 

12 

12 

12 

12 

Total 






75 30 


5. A cada clasificación asignada en la columna 6 se le da el mismo signo que tenía en la dife- 
rencia original, y los resultados se reportan en la columna 7. Por ejemplo, el segundo par- 
ticipante tiene una diferencia de -8 y un rango de 6. Este valor se coloca en la sección R 
de la columna 7. 

6. Se obtienen los totales de las columnas R H y R '. La suma de los rangos positivos es 75, 
y la suma de los rangos negativos es 30. La menor de las dos sumas de los rangos se uti- 
liza como el estadístico de prueba y se conoce como T. 

En el apéndice B.7 aparecen los valores críticos de la prueba de rangos con signo de Wilcoxon. 
Una parte de esa tabla se muestra en la siguiente página. La fila a se utiliza para pruebas de 
una cola, y la fila 2 a, para pruebas de dos colas. En este caso desea demostrar que a los clien- 
tes les gusta más el sabor a especias, que es una prueba de una cola, por lo que seleccione 
la fila a. Elija el nivel de significancia 0.05 y vaya hasta la columna con el encabezado 0.05. 
Baje por la columna hasta la fila donde n es 14. (Recuerde que una persona calificó igual a 
ambos sabores y fue eliminada del estudio; entonces, el tamaño útil de la muestra es 14.) El 
valor en la intersección es 25, por lo que el valor crítico es 25. La regla de decisión es recha- 
zar la hipótesis nula si el menor de los totales de los rangos es 25 o menor. El valor que se 
obtuvo del apéndice B.7 es el valor mayor en la región de rechazo. En otras palabras, la regla 
de decisión es rechazar H 0 si la menor de las dos sumas de los rangos es 25 o menor. En este 
caso, la suma menor del rango es 30; en consecuencia, la decisión es no rechazar la hipótesis 
nula. No es posible concluir que hay una diferencia entre las calificaciones del sabor actual y 
el sabor a especias. El señor Frick no demostró que los clientes prefieran el nuevo sabor. Es 
probable que continúe con el sabor actual y no cambie al sabor a especias. 


18.3 Prueba de rangos con signo de Wilcoxon para muestras dependientes 
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n 

2 a .15 
a .075 

.10 

.05 

.05 

.025 

.04 

.02 

.03 

.015 

.02 

.01 

.01 

.005 

4 

0 







5 

1 

0 






6 

2 

2 

0 

0 




7 

4 

3 

2 

1 

0 

0 


8 

7 

5 

3 

3 

2 

1 

0 

9 

9 

8 

5 

5 

4 

3 

1 

10 

12 

10 

8 

7 

6 

5 

3 

11 

16 

13 

10 

9 

8 

7 

5 

12 

19 

17 

13 

12 

11 

9 

7 

13 

24 

21 

17 

16 

14 

12 

9 

14 

28 


21 

19 

18 

15 

12 

15 

33 

30 

25 

23 

21 

19 

15 



El área de ensamblado de Gotrac Products se rediseñó hace poco. La instalación de un nuevo sis- 
tema de iluminación y la compra de nuevas mesas de trabajo son dos características de las modifi- 
caciones. El supervisor de producción quiere saber si los cambios generaron un aumento de la 
productividad de ios empleados. Con ei fin de investigar esta cuestión, seleccionó una muestra de 
1 1 empleados para determinar las tasas de producción antes y después de los cambios. La infor- 
mación de la muestra es la siguiente: 


Operador 

Producción 

antes 

Producción 

después 

S.M. 

17 

18 

D.J. 

21 

23 

M.D. 

25 

22 

B.B. 

15 

25 

M.F. 

10 

28 

A.A. 

16 

16 


Operador 

Producción 

antes 

Producción 

después 

U.Z. 

10 

22 

v.u. 

20 

19 

U.T. 

17 

20 

Y.H. 

24 

30 

Y.Y. 

23 

26 


a) ¿Cuántos pares útiles hay? Es decir, ¿cuál es el valor de n? 

b) Utilice la prueba de rangos con signo de Wilcoxon para determinar si en realidad los nuevos pro- 
cedimientos incrementaron la producción. Utilice un nivel de significancia de 0.05 y una prueba 
de una cola. 

c) ¿Qué suposición debe hacer acerca de la distribución de las diferencias entre las producciones 
antes y después del rediseño? 


comed: 


Ejercicios 

11. Un psicólogo industrial seleccionó una muestra aleatoria de siete parejas de profesionales urba- 
nas jóvenes que viven en casa propia. El tamaño de su casa (en pies cuadrados) se compara con 
la de sus padres. Con un nivel de significancia de 0.05, ¿es posible concluir que las parejas de pro- 
fesionales viven en casas más grandes que las de sus padres? 


Apellido de la pareja 

Profesionales 

Padres 

Apellido de la pareja 

Profesionales 

Padres 

Gordon 

1 725 

1 175 

Kuhlman 

1 290 

1 360 

Sharkey 

1 310 

1 120 

Welch 

1 880 

1 750 

Uselding 

1 670 

1 420 

Anderson 

1 530 

1 440 

Bell 

1 520 

1 640 





12. La Toyota Motor Company estudia el efecto de la gasolina normal en comparación con la de alto 
octanaje sobre el ahorro de combustible de su nuevo motor V6 de alto desempeño de 3.5 litros. 
Se selecciona a diez ejecutivos y se les pide que registren el número de millas que recorren por 
galón. Los resultados son: 
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Ejecutivo 

Millas por galón 

Regular 

Alto octanaje 

Bowers 

25 

28 

Demars 

33 

31 

Grasser 

31 

35 

DeToto 

45 

44 

Kleg 

42 

47 


Ejecutivo 

Millas por galón 

Regular 

Alto octanaje 

Rau 

38 

40 

Greolke 

29 

29 

Burns 

42 

37 

Snow 

41 

44 

Lawless 

30 

44 


A un nivel de significancia de 0.05, ¿hay alguna diferencia entre las millas que recorren por galón 
con gasolina normal y con la de alto octanaje? 

13. El señor Mump sugiere un nuevo procedimiento para incrementar la producción de la línea de 
ensamblado. Para probar si el nuevo procedimiento es mejor que el anterior, selecciona una mues- 
tra aleatoria de 15 trabajadores de la línea. Se determina el número de unidades que se producen 
en una hora con el procedimiento anterior y luego se aplica el nuevo procedimiento de Mump. 
Después de un periodo prudente para que los operarios se familiarizaran con el nuevo procedi- 
miento, se midió de nuevo su producción. Los resultados son: 



Producción 



Producción 

Empleado Sistema anterior 

Sistema de Mump 

Empleado 

Sistema anterior Sistema de Mump 

A 

60 

64 

1 

87 

84 

B 

40 

52 

J 

80 

80 

C 

59 

58 

K 

56 

57 

D 

30 

37 

L 

21 

21 

E 

70 

71 

M 

99 

108 

F 

78 

83 

N 

50 

56 

G 

43 

46 

0 

56 

62 

H 

40 

52 





A un nivel de significancia de 0.05, ¿es posible concluir que la producción aumenta con el siste- 
ma de Mump? 

a) Formule las hipótesis nula y alternativa. 

b) Formule la regla de decisión. 

c) Llegue a una decisión respecto de la hipótesis nula. 

14. Se sugirió que la producción diaria de una parte de subensamblado aumentaría si se instalara una 
mejor iluminación, se tocara música de fondo y se ofreciera café y rosquillas gratis durante el día. 
La gerencia acordó probar el esquema durante cierto tiempo. El número de subensamblados que 
producen por día una muestra de empleados es el siguiente. 


Registro de la 
producción 
Empleado Record 

Producción 
después de 
los cambios 

Registro de la 
producción 
Empleado anterior 

Producción 
después de 
los cambios 

JD 

23 

33 

WWJ 

21 

25 

SB 

26 

26 

0P 

25 

22 

MD 

24 

30 

CD 

21 

23 

RCF 

17 

25 

PA 

16 

17 

MF 

20 

19 

RRT 

20 

15 

UHH 

24 

22 

AT 

17 

9 

IB 

30 

29 

QQ 

23 

30 


Aplique la prueba de rangos con signo de Wilcoxon y determine si los cambios sugeridos valen la 
pena. 

a) Formule la hipótesis nula. 

b) Decida sobre la hipótesis alternativa. 

c) Elija un nivel de significancia. 

d) Formule la regla de decisión. 

e) Calcule T y tome una decisión. 

f) ¿Qué supuso acerca de la distribución de las diferencias? 


18.4 Prueba de Wilcoxon de la suma de rangos de muestras independientes 


695 


OA4 Realizar e interpretar 
la prueba de la suma de los 
rangos de Wilcoxon de 
muestras independientes. 


Prueba basada en la suma de 
rangos. 


Cjemplo 


Solución 


18.4 Prueba de Wilcoxon de la suma 

de rangos de muestras independientes 

Un procedimiento diseñado para determinar si dos muestras independientes provienen de 
poblaciones equivalentes es la prueba de Wilcoxon de la suma de rangos. Esta prueba es 
una alternativa a la prueba t de dos muestras descrita en la página 383, capítulo 1 1 . Recuerde 
que la prueba t requiere que las dos poblaciones sigan la distribución normal y tengan varian- 
zas poblacionales iguales. La prueba de Wilcoxon de la suma de rangos no requiere estas con- 
diciones. 

Esta prueba se basa en la suma de los rangos. Los datos se clasifican como si las obser- 
vaciones fueran parte de una sola muestra. Si la hipótesis nula es verdadera, los rangos ten- 
drán una distribución casi uniforme entre las dos muestras, y la suma de los rangos de las dos 
muestras será casi igual. Es decir, los rangos bajo, medio y alto deberán dividirse en forma 
equitativa entre las dos muestras. Si la hipótesis alternativa es verdadera, una de las muestras 
tendrá mayor cantidad de rangos bajos y, por lo tanto, una suma de rangos menor. La otra 
muestra tendrá mayor cantidad de rangos altos, por lo que la suma de rangos será mayor. Si 
cada una de las muestras contiene al menos ocho observaciones, se utiliza la distribución nor- 
mal estándar como estadístico de prueba. La fórmula es: 


PRUEBA DE WILCOXON DE LA SUMA DE RANGOS 


w _ n Án^ + n 2 + 1) 
2 

//iin 2 (ni + n 2 + 1) 

V 12 




(18-4) 


y 


donde: 

n-, es el número de observaciones de la primera muestra. 
n 2 es el número de observaciones de la segunda muestra. 
1/1/ es la suma de los rangos de la primera población. 


Dan Thompson, presidente de CEO Airlines, hace poco observó un aumento del número de 
personas que no llegan a tomar los vuelos que salen de Atlanta. Su interés principal es deter- 
minar si hay más personas que no se presentan a tomar los vuelos que salen de Atlanta en 
comparación con vuelos que salen de Chicago. Una muestra de nueve vuelos de Atlanta y 
ocho de Chicago aparece en la tabla 18-4. Con un nivel de significancia de 0.05, ¿es posible 
concluir que hay más personas que no se presentan a tomar los vuelos que salen de Atlanta? 


TABLA 18-4 Número de personas que no se presentan a los vuelos programados 


Atlanta 

Chicago 

Atlanta 

Chicago 

11 

13 

20 

9 

15 

14 

24 

17 

10 

10 

22 

21 

18 

8 

25 


11 

16 




Si las poblaciones de personas que no se presentan a tomar los vuelos siguen la distribución 
normal de probabilidad y tienen varianzas iguales, es adecuada la prueba t de dos muestras 
que estudió en la sección 11.4 del capítulo 11. En este caso, Thompson considera que estas 
dos condiciones no se pueden cumplir. Por lo tanto, la prueba adecuada es la no paramétrica 
de Wilcoxon de la suma de rangos. 
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Si el número de personas que no se presentan a tomar los vuelos es el mismo en Atlanta 
que en Chicago, ambas poblaciones serán casi iguales. Si el número de personas que no se 
presentan no es el mismo, las dos sumas de los rangos serán muy diferentes. 

Thompson considera que más personas pierden su vuelo en Atlanta. Por ello, es adecua- 
da una prueba de una cola, con la reglón de rechazo en la cola derecha. Las hipótesis nula y 
alternativa son: 

H 0 : La distribución de la población de personas que no se presentan es la misma o menor 
en Atlanta que en Chicago. 

La distribución de la población de las personas que no se presentan en Atlanta es 
mayor que en Chicago. 

El estadístico de prueba sigue la distribución normal estándar. Con un nivel de significan- 
cia de 0.05, se determina, del apéndice B.1 , que el valor crítico de z es 1 .65. La hipótesis nula 
se rechaza si el valor calculado de z es mayor que 1 .65. 

La hipótesis alternativa es que hay más personas que no se presentan en Atlanta, lo que 
significa que la distribución se ubica a la derecha de la distribución de Chicago. Los detalles 
de la asignación del rango aparecen en la tabla 1 8-5. Se clasificaron las observaciones de 
ambas muestras como si fueran un solo grupo. El vuelo de Chicago con sólo 8 personas que 
no se presentaron tuvo la menor cantidad, por lo que se le asignó un rango de 1, al vuelo de 
Chicago con 9 personas ausentes, un rango de 2, y así en lo sucesivo. El vuelo de Atlanta con 
25 personas que no se presentaron es el mayor, por lo que se le asigna el mayor rango, 1 7. 
También hay dos casos de rangos iguales. Hay un vuelo de Atlanta y otro de Chicago a los que 
no se presentaron 10 personas, y dos vuelos de Atlanta con 1 1 asientos vacíos. ¿Cómo mane- 
jar estos empates? La solución es promediar los rangos y asignar el rango promedio a los dos 
vuelos. En el caso que comprende 10 personas que no se presentaron, los rangos compren- 
didos son 3 y 4. La media de estos rangos es 3.5, por lo que se asigna un rango de 3.5 a los 
dos vuelos de Atlanta y de Chicago con 10 personas que no se presentaron. 

TABLA 1 5 Números de rango de las personas que no se presentaron a los vuelos programados 


Atlanta 


Chicago 


No se presentaron 

Rango 

No se presentaron 

Rango 

11 

5.5 

13 

7 

15 

9 

14 

8 

10 

3.5 

10 

3.5 

18 

12 

8 

1 

11 

5.5 

16 

10 

20 

13 

9 

2 

24 

16 

17 

11 

22 

15 

21 

14 

25 

17 




96.5 


56.5 


La suma de rangos de los vuelos de Atlanta es 96.5. Éste es el valor de W en la fórmula 
(1 8-4). Observe en la tabla 1 8-5 que hay nueve vuelos que salen de Atlanta y ocho de Chicago, 
por lo que n 1 = 9 y n 2 = 8. Al calcular z a partir de la fórmula (1 8-4): 

w _ n 1 (n 1 + n 2 + 1) _ 9(9 + 8 + 1) 

z = — 2 = 2 = i .49 

/r)ir? 2 (r)i + n 2 + 1) j 9(8)(9 + 8 + 1) 

V 12 V 12 

Como el valor z calculado (1 .49) es menor que 1 .65, no se rechaza la hipótesis nula. La eviden- 
cia no muestra una diferencia entre las distribuciones de los números de personas que no se 
presentaron. Es decir, parece que el número de personas que pierden el vuelo es el mismo en 
Atlanta que en Chicago. El valor p es 0.0681 , que se encontró al determinar el área a la dere- 
cha de 1.49 (0.5000 - 0.4319), indica el mismo resultado. 


18.4 Prueba de Wilcoxon de la suma de rangos de muestras independientes 
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El software de MegaStat produce los mismos resultados. El valor p de MegaStat es 0.0742, 
que se aproxima al valor anterior. La diferencia es por el redondeo del sistema y la corrección 
de los empates. 



Al emplear la prueba de Wilcoxon de la suma de los rangos, puede numerar las dos pobla- 
ciones en cualquier orden. Sin embargo, una vez que haga una elección, 1/1/ debe ser la suma 
de los rangos identificados como la población 1. Si, en el ejemplo de las personas que no se 
presentaron a los vuelos, la población de Chicago se identificara como el número 1 , la direc- 
ción de la hipótesis alternativa cambiaría, pero el valor absoluto de z aún sería el mismo. 

H 0 : La distribución de la población de personas que no se presentaron en Chicago es la 
misma o mayor que en Atlanta. 

La distribución de la población de personas que no se presentaron en Chicago es 
menor que en Atlanta. 

El valor calculado dez es -1.49, determinado por: 


W ~ ni(f?1 + n¿ + 1} 56.5 - 8(8 + 9 + 1} 


z = 


n i n 2 ( n i + n 2 + 1) 


12 


8(9)(8 


1 ) 


= -1.49 


12 


La conclusión es la misma que antes. No hay una diferencia entre los números habituales 
de personas que no se presentaron en Chicago y Atlanta. 



El director de investigación de Top Flite quiere saber si hay una diferencia entre las distribuciones 
de las distancias recorridas por dos pelotas de golf de la compañía. Se lanzaron ocho pelotas de su 
modelo XL-5000 y ocho D2 con un dispositivo automático. Las distancias (en yardas) son las 
siguientes: 


XL-5000: 252, 263, 279, 273, 271 , 265, 257, 280 
D2: 262, 242, 256, 260, 258, 243, 239, 265 


No suponga que las distribuciones de las distancias recorridas siguen la distribución normal de pro- 
babilidad. A un nivel de significancia de .05, ¿hay alguna diferencia entre las dos distribuciones? 
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CAPÍTULO 18 Métodos no paramétrícos: análisis de datos ordenados 


comed 


OA5 Realizar e interpretar 
la prueba de Kruskal-Wallis 
de varias muestras 
independientes. 


Ejercicios 

15 . Se seleccionaron las siguientes observaciones de manera aleatoria de poblaciones que no nece- 
sariamente tenían una distribución normal. Utilice un nivel de significancia de 0.05, una prueba de 
dos colas y la prueba de Wilcoxon de la suma de los rangos para determinar si hay una diferencia 
entre las dos poblaciones. 


Población A: 38, 45, 56, 57, 61 , 69, 70, 79 

Población B: 26, 31 , 35, 42, 51 , 52, 57, 62 


16 . Se seleccionaron las siguientes observaciones de manera aleatoria de poblaciones que no nece- 
sariamente tenían una distribución normal. Utilice un nivel de significancia de 0.05, una prueba de 
dos colas y la prueba de Wilcoxon de la suma de los rangos para determinar si hay una diferencia 
entre las dos poblaciones. 


Población A: 

12, 14, 15, 19, 23, 29, 33, 40, 51 

Población B: 

13, 16, 19, 21, 22, 33, 35, 43 


17 . La Tucson State University ofrece dos programas de maestría en administración de empresas. En 
el primer programa, los estudiantes se reúnen dos noches por semana en el campus principal, 
en el centro de Tucson. En el segundo programa, sólo se comunican por internet con el profesor. 
El director de la maestría de Tucson quiere comparar el número de horas que estudiaron la sema- 
na pasada los dos grupos. Una muestra de 10 estudiantes en el campus y otra de 12 estudiantes 
por internet reveló la siguiente información. 


Campus 28, 16, 42, 29, 31 , 22, 50, 42, 23, 25 

Por internet 26, 42, 65, 38, 29, 32, 59, 42, 27, 41, 46, 18 


No suponga que las dos distribuciones del tiempo de estudio, que se reportan en horas, siguen 
una distribución normal. A un nivel de significancia de 0.05, ¿es posible concluir que los estudian- 
tes por internet estudian más? 

18 . En fechas recientes, debido a los bajos niveles de las tasas hipotecarias, las instituciones finan- 
cieras han comenzado a ofrecer mayores beneficios a los clientes. Una innovación de Coastal 
National Bank and Trust es la presentación de solicitudes por internet. En la siguiente tabla apare- 
ce el tiempo, en minutos, necesario para completar el proceso de solicitud de clientes que piden 
un préstamo hipotecario de tasa fija a 15 años y 30 años. 


Tasa fija a 15 años 41 , 36, 42, 39, 36, 48, 49, 38 

Tasa fija a 30 anos 21 , 27, 36, 20, 19, 21 , 39, 24, 22 


A un nivel de significancia de 0.05, ¿es posible concluir que el proceso que deben cubrir los clien- 
tes que solicitan un préstamo hipotecario a tasa fija a 30 años tarda menos? No suponga que la 
distribución del tiempo sigue una distribución normal para algún grupo. 


18.5 Prueba de Kruskal-Wallis: 

análisis de la varianza por rangos 

El procedimiento del análisis de la varianza (ANOVA) que se estudió en el capítulo 12 se rela- 
ciona con la Igualdad de las medias de varias poblaciones. Los datos estaban en un nivel de 
intervalo o de razón. Asimismo, se supuso que las poblaciones seguían la distribución normal 
de probabilidad y que sus desviaciones estándar eran ¡guales. ¿Qué sucede si los datos están 
a escala ordinal y/o las poblaciones no siguen una distribución normal? En 1952, W.H. Kruskal 


18.5 Prueba de Kruskal-Wallis: análisis de la varíanza por rangos 
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La prueba requiere muestras 
independientes, pero las 
poblaciones no tienen que ser 
normales. 


Cjemplo 


Solución 


y W.A. Wallis reportaron una prueba no paramétrica que sólo requería datos de nivel ordinal 
(clasificados). No se requieren suposiciones acerca de la forma de las poblaciones. A la prue- 
ba se le conoce como análisis en una dirección de la varianza por rangos de Kruskal- 
Wallis. 

Para la aplicación de la prueba de Kruskall-Wallis, las muestras seleccionadas de la pobla- 
ción deben ser independientes. Por ejemplo, si selecciona y entrevista muestras de tres gru- 
pos — ejecutivos, personal y supervisores — , las respuestas de un grupo (ejecutivos) no deben 
por ningún motivo influir en las respuestas de los demás. 

Para calcular el estadístico de prueba de Kruskal-Wallis, 1) se combinan todas las mues- 
tras, 2) se ordenan los valores combinados de bajo a alto y 3) los valores ordenados se reem- 
plazan por rangos, a partir de 1 para el valor menor. Un ejemplo aclarará los detalles del 
procedimiento. 


El Hospital System of the Carolinas opera tres hospitales en el área de Great Charlotte: St. 
Luke’s Memorial, en el lado poniente de la ciudad, Swedish Medical Center, al Sur, y el 
Piedmont Hospital en el lado Este. El director de administración está preocupado acerca del 
tiempo de espera de los pacientes con lesiones de tipo deportivo, que no ponen en peligro la 
vida, y que llegan durante las tardes entre semana a los tres hospitales. Específicamente, 
¿existe una diferencia en los tiempos de espera en los tres hospitales? 

Para averiguarlo, el director seleccionó una muestra aleatoria de pacientes en los tres hospita- 
les y determinó el tiempo, en minutos, en que se entra a un hospital y el momento en que ter- 
mina el tratamiento. Los tiempos en minutos se reportan en la tabla 18-6. 

TABLA 1 1 Tiempos de espera de los pacientes en la sala de urgencias en el Sistema Hospitalario 

de las Carolinas 



En la tabla 18-6 observamos que el tiempo de espera más corto, 35 minutos, es del quin- 
to paciente muestreado en el Piedmont Hospital. El tiempo más largo, 107 minutos, le tocó al 
séptimo paciente muestreado en el Swedish Medical Center. 

Probablemente, el primer enfoque para comparar los tiempos de espera es determinar si 
existe una diferencia entre los tiempos de espera medios en los tres hospitales, esto es, utili- 
zar la ANOVA de una vía descrita en la sección 1 2.5. Sin embargo, como se describió en la sec- 
ción 12.4, esta prueba exige tres requisitos: 

1 . Las muestras deben ser de poblaciones independientes. 

2. Las varianzas de la población deben ser iguales. 

3. Las muestras deben ser de poblaciones normales. 

En este caso, las muestras provienen de poblaciones independientes, que son los tres 
hospitales. Pero suponga que no quiere asumir que hay una varianza igual en los tiempos de 
espera en los tres hospitales o que estos tiempos de espera siguen una distribución de proba- 
bilidad normal. La falta de estos dos criterios significa que no se cubren los requisitos de 
ANOVA, así que no se puede utilizar esta técnica. En vez de eso, recurrimos a la prueba de 
Kruskal-Wallis, donde no se requieren estas suposiciones. 
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CAPÍTULO 18 Métodos no paramétricos: análisis de datos ordenados 


El primer paso en la prueba de hipótesis es formular las hipótesis nula y alternativa. 

H 0 : Las distribuciones de las poblaciones de los tiempos de espera son iguales para los 
tres hospitales. 

No todas las distribuciones de las poblaciones son iguales. 



El director de administración seleccionó un nivel de significancia de 0.05. 

El estadístico de prueba de la prueba de Kruskal-Wallis se designa como H, y su fórmula 
es: 


PRUEBA DE 

KRUSKAL- 

WALLIS 


H = 


12 

n(n + 1) 




(Sfí 2 ) 2 | | (Sfí/t ) 2 

n 2 n k 


3 (n + 1) 


(18-5) 


con k - 1 grados de libertad ( k es el número de poblaciones), donde: 

2R-I, Sfi 2 1,R k son las sumas de los rangos de las muestras 1,2 , ,k, respecti- 

vamente. 

n-i, n 2 , . . . , n k son los tamaños de las muestras 1, 2, . . . k, respectivamente. 

n es el número combinado de observaciones de todas las muestras. 


La distribución del estadístico de prueba H es muy similar a la distribución ji cuadrada con 
k - 1 grados de libertad. Es preferible que cada muestra incluya al menos 5 observaciones. 
Utilice ji cuadrada para formular la regla de decisión. En este ejemplo hay tres poblaciones: una 
población de tiempos de espera de pacientes en St. Luke’s Memorial, otra de pacientes del 
Swedish Medical Center, y una tercera de los pacientes de Piedmont Hospital. Por lo tanto, hay 
k — 1, es decir, 3-1=2 grados de libertad. Consulte la tabla de ji cuadrada de los valores 
críticos en el apéndice B.3. El valor crítico de 2 grados de libertad y el nivel de significancia de 

0. 05 es 5.991 . No rechace H 0 si el valor calculado del estadístico de prueba H es menor o igual 
a 5.991 . Rechace H 0 si el valor calculado de H es mayor que 5.991 y acepte 

El paso siguiente es determinar el valor del estadístico de prueba. Remplazamos los tiem- 
pos de espera en los tres hospitales por sus rangos correspondientes. Considerando los 
tiempos de espera como una sola población, el paciente de Piedmont con un tiempo de espe- 
ra de 35 minutos aguardó el tiempo más corto y, por lo tanto, se le otorga el rango más bajo, 

1. Hay dos pacientes que esperaron 38 minutos, uno en St. Luke’s y el otro en Piedmont. Para 
resolver este empate, se otorga a cada paciente un rango de 2.5, calculado mediante (2 + 3)/2. 
El proceso continúa con todos los tiempos de espera. El más largo es de 107 minutos, y ese 
paciente del Swedish Medical Center recibe un rango de 21 . La tabla 18-7 muestra las califica- 
ciones, los rangos y la suma de los rangos en cada uno de los tres hospitales. 


TABLA 18-7 Tiempos de espera, rangos y suma de rangos en el Hospital System of the Carolinas 



18.5 Prueba de Kruskal-Wallis: análisis de la varíanza por rangos 
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Al despejar H, se obtiene 


H = 


12 


n{n + 1) 
12 


(Z ^) 2 , (SR 2 ) 2 , ( 2 fí 3 ) 2 


21(21 + 1) 


n i 

58. 5 2 


120 2 

+ _ + 


n 3 

52. 5 2 


- 3 (n + 1) 

- 3(21 + 1) = 5.38 


Como el valor calculado de H (5.38) es menor que el valor crítico de 5.991, no se rechaza 
la hipótesis nula. No hay evidencia suficiente para concluir que existe una diferencia entre los 
tiempos de espera en los tres hospitales. 

Es posible también realizar el procedimiento de Kruskal-Wallis con el software de Minitab. 
La captura de pantalla del ejemplo respecto del conocimiento de los principios de administra- 
ción de ejecutivos de varias industrias es el siguiente. El valor calculado de H es 5.38, y el valor 
p que se reporta en la salida es 0.068, lo que concuerda con los cálculos anteriores. 
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Recuerde, del capítulo 12, que los supuestos para la aplicación de la técnica del análisis 
de la varianza son: 1) las poblaciones están normalmente distribuidas, 2) estas poblaciones 
tienen desviaciones estándares iguales y 3) las muestras se seleccionan de manera indepen- 
diente. Si se cumplen estas suposiciones en el ejemplo de los tiempos de espera en los hos- 
pitales, utilice la distribución Fcomo estadístico de prueba. Si no es así, aplique la prueba de 
Kruskal-Wallis sin distribución. Para resaltar las similitudes entre estos dos enfoques, se 
resuelve el ejemplo respecto del conocimiento de los principios de administración de ejecuti- 
vos mediante la técnica ANOVA. 

Para iniciar, formule las hipótesis nula y alternativa de los tres grupos. 

H 0 : M-i = |¿ 2 = A3 

No todas las medias de tratamiento son iguales. 

Para un nivel de significancia de 0.05, con /c — 1 = 3 — 1 = 2 grados de libertad en el 
numerador y n — /c = 21 - 3 = 18 grados de libertad en el denominador, el valor crítico de F 
es 3.55. La regla de decisión es rechazar la hipótesis nula si el valor calculado de F es mayor 
que 3.55. La captura de pantalla con Excel es la siguiente. 
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CAPÍTULO 18 Métodos no paramétrícos: análisis de datos ordenados 



Resultados similares de la En la captura de pantalla anterior, el valor calculado de F es 3.822, y el valor p, .041 . La deci- 
ANOVA de una vía y la prueba sión es rechazar la hipótesis nula y aceptar la hipótesis alternativa. Utilizando la prueba ANOVA 
de Kruskal-Wallis. de una vía, se concluye que los tiempos de espera medios en los tres hospitales del Sistema 

Hospitalario de las Carolinas son distintos. 

Hay conclusiones contradictorias sobre los mismos datos. ¿Por qué resulta así? Si com- 
para los resultados con el empleo de valores p, las respuestas son similares. En el caso de la 
prueba de Kruskal-Wallis el valor p fue 0.057, que sólo es un poco mayor que el nivel de sig- 
nificancia 0.05, pero la regla de decisión fue no rechazar H 0 . El valor p mediante ANOVA es 
0.041 , que no es mucho menor que el valor crítico en la región de rechazo. Por lo tanto, para 
resumir, apenas falló en rechazar H 0 con la prueba de Kruskal-Wallis y apenas estuvo en la 
región de rechazo mediante ANOVA. La diferencia entre los valores p es 0.016. Por lo tanto, 
en realidad los resultados están muy cercanos en términos de los valores p. 


r 


Autoevaluación 


18-6 



El gerente del banco regional Statewide Financial Bank tiene interés en el índice de movimientos de 
dinero de las cuentas de cheques personales en cuatro sucursales. (El índice de movimientos es la 
velocidad a la que el dinero en una cuenta se deposita y se retira; una cuenta extremadamente acti- 
va puede tener un índice de 300; si sólo se emiten uno o dos cheques, el índice puede ser de 30, 
aproximadamente). Los índices de rotación de las muestras seleccionadas de las cuatro sucursales 
bancarias aparecen en la siguiente tabla. Con un nivel de significancia de 0.01 y la prueba de 
Kruskal-Wallis, determine si hay una diferencia entre los índices de rotación de las cuentas de che- 
ques personales de las cuatro sucursales. 


Sucursal 

Englewood 

Sucursal 

West 

Side 

Sucursal 

Great 

Northern 

Sucursal 

Sylvania 

208 

91 

302 

99 

307 

62 

103 

116 

199 

86 

319 

189 

142 

91 

340 

103 

91 

80 

180 

100 

296 



131 


comed 


Ejercicios 

19. ¿En qué condiciones debe utilizar la prueba de Kruskal-Wallis en lugar del análisis de la varianza? 

20 . ¿En qué condiciones debe utilizar la prueba de Kruskal-Wallis en lugar de la prueba de Wilcoxon 
de la suma de los rangos? 

21 . Los siguientes datos de la muestra se obtuvieron de tres poblaciones que no siguen una distribu- 
ción normal. 



18.5 Prueba de Kruskal-Wallis: análisis de la varianza por rangos 
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Muestra 1 

Muestra 2 

Muestra 3 

50 

48 

39 

54 

49 

41 

59 

49 

44 

59 

52 

47 

65 

56 

51 


57 



a) Formule la hipótesis nula. 

b) Con un nivel de significancia de 0.05, formule la regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d ) ¿Cuál es su decisión respecto de la hipótesis nula? 

22. Los siguientes datos de una muestra provienen de tres poblaciones donde las varianzas no son 
iguales, pero usted quiere compararlas. 


Muestra 1 

Muestra 2 

Muestra 3 

21 

15 

38 

29 

17 

40 

35 

22 

44 

45 

27 

51 

56 

31 

53 

71 




a) Formule la hipótesis nula. 

b) Con un nivel de significancia de 0.01 , formule la regla de decisión. 

c) Calcule el valor del estadístico de prueba. 

d ) ¿Cuál es su decisión respecto de la hipótesis nula? 

23. Flace poco, Davis Outboard Motors, Inc., desarrolló un proceso de pintura epóxica para proteger 
contra la oxidación de componentes del sistema de escape. Bill Davies, el propietario, quiere 
determinar si la duración de la vida útil de la pintura es igual en tres condiciones diferentes: agua 
salada, agua dulce sin algas y agua dulce con una alta concentración de algas. Se realizaron prue- 
bas aceleradas de la duración en el laboratorio y se registró el número de horas que duró la pin- 
tura sin caerse. 


Agua salada 

Agua dulce 

Agua dulce 
con algas 

167.3 

160.6 

182.7 

189.6 

177.6 

165.4 

177.2 

185.3 

172.9 

169.4 

168.6 

169.2 

180.3 

176.6 

174.7 


Utilice la prueba de Kruskal-Wallis y un nivel de significancia de 0.01 para determinar si la calidad 
de duración de la pintura es la misma en las tres condiciones. 

24. La National Turkey Association quiere experimentar con tres mezclas diferentes de alimentos para 
pavos muy jóvenes. Como no existen registros respecto de las tres mezclas, no es posible hacer 
suposiciones acerca de la distribución de los pesos. Para estudiar los efectos de las tres mezclas, 
cinco pavos reciben el alimento A, seis el B y otros cinco el C. A un nivel de significancia de 0.05, 
evalúe la hipótesis de que la mezcla de alimento no tiene efecto en el peso. 


Peso (en libras) 

Mezcla de alimento A 

Mezcla de alimento B 

Mezcla de alimento C 

11.2 

12.6 

11.3 

12.1 

10.8 

11.9 

10.9 

11.3 

12.4 

11.3 

11.0 

10.6 

12.0 

12.0 

12.0 


10.7 
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CAPÍTULO 18 Métodos no paramétricos: análisis de datos ordenados 


OA6 Calcular e interpretar 
el coeficiente de correlación 
de los rangos de Spearman. 


Cjemplo 


18.6 Correlación por orden de rango 

En el capítulo 13 se analizó r, el coeficiente de correlación de una muestra. Recuerde que r 
mide la asociación entre dos variables en escala de intervalo o de razón. Por ejemplo, el coe- 
ficiente de correlación reporta el vínculo entre el salarlo de ejecutivos y sus años de experien- 
cia, o entre el número de millas que un embarque tiene que recorrer y el número de días que 
tarda en llegar a su destino. 

Charles Spearman, estadístico británico, introdujo una medida para correlacionar datos 
de nivel ordinal. Esta medida permite describir la relación entre conjuntos de datos clasifica- 
dos. Por ejemplo, a dos miembros del personal en la Office of Research de la Universlty of the 
Valley se les pide clasificar 10 propuestas de investigación de la facultad con fines de recolec- 
ción de fondos. Aquí interesa estudiar la relación entre las calificaciones de los dos miembros 
del personal. Es decir, ¿los empleados califican las mismas propuestas como las más valiosas 
y las menos valiosas para los fondos? El coeficiente de correlación por rangos de Spearman, 
denotado r s , proporciona una medida de la asociación. 

El coeficiente de correlación por rangos se calcula mediante la siguiente fórmula. 


COEFICIENTE DE CORRELACIÓN r = 1 - 62af2 

POR RANGOS DE SPEARMAN s n(n 2 - 1) 


( 18 - 6 ) 

J 


donde: 

d es la diferencia entre los rangos por cada par. 

n es el número de observaciones por pares. 

Al Igual que el coeficiente de correlación, el coeficiente de correlación por rangos adopta 
cualquier valor en el intervalo de —1 .00 a 1 .00. Un valor de -1.00 Indica una correlación nega- 
tiva perfecta, y un valor de 1 .00, una correlación positiva perfecta entre los rangos. Una corre- 
lación de rangos de 0 indica que no hay asociación entre los rangos. Correlaciones de rangos 
de -0.84 y 0.80 Indican una asociación fuerte, pero la primera indica una relación inversa entre 
los rangos, y la última, una relación directa. 


Lorrenger Plastics, Inc., contrata a gerentes en capacitación provenientes de universidades de 
Estados Unidos. A cada aspirante el reclutador le asigna una calificación durante la entrevista 
en el campus. Esta calificación es una expresión del potencial futuro y varía de 0 a 200; la cali- 
ficación más alta indica más potencial. Si el aspirante es contratado por Lorrenger, ingresa a 
un programa de capacitación en la planta. Al terminarlo, recibe otra calificación compuesta, 
con base en pruebas, opiniones de líderes de grupo y de personal de entrenamiento, cuyo 
rango va de 0 a 100. Nuevamente, una calificación más alta indica un mayor potencial. La cali- 
ficación en el campus y las calificaciones en la planta aparecen en la tabla 18-8. 


TABLA 1 8-8 Calificaciones en el campus y en la capacitación en la planta de recién graduados 
de la universidad 


Graduado 

Calificación en campus, X 

Calificación de capacitación, Y 

Spina, Sal 

83 

45 

Gordon, Ray 

106 

45 

Althoff, Roberta 

92 

45 

Alvear, Ginny 

48 

36 

Wallace, Ann 

127 

68 

Lyons, George 

113 

83 

Harbin, Joe 

118 

88 


( continúa ) 
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Graduado 

Calificación en campus, X 

Calificación de capacitación, Y 

Davison, Jack 

78 

61 

Brydon, Tom 

83 

66 

Bobko, Jack 

193 

94 

Koppel, Marty 

101 

56 

Nyland, Patricia 

123 

91 


Solución 


Determine la asociación entre las calificaciones en el campus y en la planta. ¿Los recluta- 
dos que obtienen mayores calificaciones en la entrevista en el campus obtienen también las 
puntuaciones más altas durante su entrenamiento en la planta? 

En la sección 4.6 se investigó la asociación entre dos variables mediante un diagrama de dis- 
persión. Éste es un buen punto de partida. Abajo se muestra un diagrama de dispersión de la 
asociación entre las calificaciones del campus y de la planta. Es claro que existe una asocia- 
ción directa o positiva entre ambas calificaciones. Sin embargo, observe el trazo para Jack 
Bobko, el tercer graduado de abajo hacia arriba. Su puntuación en el campus, 193, es 66 pun- 
tos más alta que la de Ann Wallace, que obtuvo la siguiente puntuación más alta. El trazo de 
Bobko es un dato atípico potencial con respecto a los otros, y puede distorsionar la asociación 
entre las dos variables. 



Estadística en acción 

Los manatíes son mamífe- 
ros grandes que suelen 
flotar a pocos centímetros 
por debajo de la superfi- 
cie del agua. Debido a 
esto, están en peligro de 
ser alcanzados por las 
hélices del motor de las 
embarcaciones. Un estu- 
dio de la correlación 
entre el número de 
embarcaciones registradas 
en los condados de la 
costa de Florida y el 
número de muertes acci- 
dentales de manatíes 
reveló una fuerte correla- 
ción positiva. Como 
resultado, en Florida se 
designaron regiones 
donde se prohíben las 
embarcaciones de motor, 
a fin de proteger a los 
manatíes. 
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Diagrama de dispersión de las calificaciones de los reclutados 
por Lorrenger Plastics en el campus y en la planta 
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La medida usual de asociación es el coeficiente de correlación, descrito en la sección 
13.3, página 468. Esta medida de asociación requiere que ambas variables estén en una 
escala de intervalo. En este caso, las calificaciones son de escala de intervalo, pero el 
hecho de que una de ellas sea mucho más alta, un dato atípico, es un problema. Como 
ese punto parece ser tan diferente de los otros, los estadísticos suelen recomendar que se 
utilice el rango de puntuaciones en vez de las calificaciones reales. El coeficiente de corre- 
lación de rangos de Spearman utiliza los rangos de las calificaciones y no las calificacio- 
nes en sí. Esto es, correlaciona los rangos y no las calificaciones, lo cual reduce el efecto 
de que la puntuación que obtuvo Bobko en el campus sea mucho más alta que las otras. 

Para calcular el coeficiente de correlación de rangos, se clasifican primero las varia- 
bles de baja a alta. Comenzamos con las calificaciones en el campus. La calificación más 
baja, 48, fue la de Ginny Alvear, quien recibió el rango 1 . La siguiente calificación más baja, 
78, fue la de Jack Davison, por lo que se le dio el rango 2. Hubo dos graduados con pun- 
tuaciones de 83. El empate se resuelve al dar a cada uno un rango de 3.5, que es el pro- 
medio de los rangos 3 y 4. El más alto en el campus fue Jack Bobko, con 1 93, quien recibió 
el mayor rango, 12. 
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Prueba para ver si la correla- 
ción entre la población es 
cero. 


Se sigue el mismo procedimiento con las calificaciones obtenidas en la planta. De nuevo, 
Ginny Alvear obtuvo la puntuación más baja, 36, así que su rango en la planta es 1. Hubo tres 
puntuaciones de 45. La media de los tres rangos empatados es 3, calculado mediante (2 + 3 
+ 4)/3 = 3, así que cada uno de estos reclutas recibió un rango en la planta de 3. En la tabla 
18-9 se ilustra lo anterior, además de los cálculos necesarios para determinar r s . 


TABLA 18-9 Cálculos necesarios para determinar el coeficiente de correlación de rangos ( rj 


Graduado 

Calificación 


Rango 

Diferencia 

en 

campus, X 

en 

capacitación, Y 

en 

campus 

en 

capacitación 

rangos, 

d 

al cuadrado, 
d 2 

Spina, Sal 

83 

45 

3.5 

3 

0.5 

0.25 

Gordon, Ray 

106 

45 

7 

3 

4.0 

16.00 

Althoff, Roberta 

92 

45 

5 

3 

2.0 

4.00 

Alvear, Ginny 

48 

36 

1 

1 

0.0 

0.00 

Wallace, Ann 

127 

68 

11 

8 

3.0 

9.00 

Lyons, George 

113 

83 

8 

9 

-1.0 

1.00 

Harbin, Joe 

118 

88 

9 

10 

-1.0 

1.00 

Davison, Jack 

78 

61 

2 

6 

-4.0 

16.00 

Brydon, Tom 

83 

66 

3.5 

7 

-3.5 

12.25 

Bobko, Jack 

193 

94 

12 

12 

0.0 

0.00 

Koppel, Marty 

101 

56 

6 

5 

1.0 

1.00 

Nyland, Patricia 

123 

91 

10 

11 

-1.0 

1.00 






0 

61.50 


El coeficiente de correlación de rangos es 0.785, determinado mediante la fórmula (18-6): 


62c/ 2 _ 6(61 .50) 

n(n 2 - 1) “ 1 2(1 2 2 - 1) 


= 1 - .215 = .785 


El valor de 0.785 indica una asociación positiva fuerte entre las calificaciones del recluta- 
dor en el campus y las del personal de capacitación. Los graduados que recibieron calificacio- 
nes altas del reclutador en el campus también fueron los que recibieron calificaciones altas del 
personal de capacitación. Sería razonable concluir que existe una asociación entre ambos gru- 
pos de calificaciones. 


Prueba de significancia de r s 

En la sección 13.4 del capítulo 13 se probó la significancia de la r de Pearson. En el caso de 
datos clasificados surge la duda de que la correlación entre la población en realidad sea cero. 
Por ejemplo, en la muestra del caso anterior se tomó a 12 graduados. En la solución del ejem- 
plo, el coeficiente de correlación por rangos, 0.785, indica una relación un tanto fuerte entre 
los dos conjuntos de rangos. ¿Es posible que la correlación de 0.785 sea casual, y que la 
correlación entre los rangos en la población de verdad sea 0? Ahora realizará una prueba de 
significancia para despejar esa duda. 

En el caso de una muestra de 10 o más, la significancia de r s se determina al calcular t 
con la siguiente fórmula. La distribución de muestreo de r s sigue la distribución t con n — 2 
grados de libertad. 


PRUEBA DE HIPÓTESIS, CORRELACIÓN POR RANGOS 



( 18 - 7 ) 

J 


Las hipótesis nula y alternativa son: 

H 0 : La correlación por rangos entre la población es cero. 
Hay una asociación positiva entre los rangos. 
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La regla de decisión es rechazar H 0 si el valor calculado de f es mayor que 1.812 (del apéndi- 
ce B.2, con un nivel de significancia de 0.05, prueba de una cola y 1 0 grados de libertad, deter- 
minado mediante n — 2 = 12 — 2 = 10). 

El valor calculado de t es 4.007: 



Se rechaza H 0 debido a que el valor t calculado de 4.007 es mayor que 1.812. Se acepta H-¡. 
Hay evidencia de una correlación positiva entre los rangos del reclutador en el campus y los 
rangos asignados durante la capacitación. 



Una muestra de personas que solicitan empleo en una fábrica de Davis Enterprises reveló las 
siguientes calificaciones sobre una prueba de percepción ocular (X) y una prueba de aptitudes para 
la mecánica (Y): 


Sujeto 

Percepción 

ocular 

Aptitud para 
la mecánica 

001 

805 

23 

002 

777 

62 

003 

820 

60 

004 

682 

40 

005 

777 

70 


Sujeto 

Percepción 

ocular 

Aptitud para 
la mecánica 

006 

810 

28 

007 

805 

30 

008 

840 

42 

009 

777 

55 

010 

820 

51 


a) Calcule el coeficiente de correlación por rangos. 

b) Con un nivel de significancia de 0.05, ¿es posible concluir que la correlación entre la población 
es diferente de 0? 


comect 


Ejercicios 

25. ¿A los esposos y las esposas les gustan los mismos programas de televisión? En un estudio 
reciente de Nielsen Media Research se pidió a matrimonios jóvenes calificar programas de mejor 
a peor. Una calificación de 1 indica el programa más agradable, y una calificación de 14, el menos 
agradable. Los resultados de una pareja casada son: 


Programa 

Calificación de los hombres 

Calificación de las mujeres 

60 Minutes 

4 

5 

CSI, New York 

6 

4 

Bones 

7 

8 

SportsCenter 

2 

7 

Late Show with David Letterman 

12 

11 

NBC Nightly News 

8 

6 

Law and Order: Los Angeles 

5 

3 

Miami Medical 

3 

9 

Survivor 

13 

2 

Office 

14 

10 

American Idol 

1 

1 

Grey’s Anatomy 

9 

13 

House 

10 

12 

Criminal Minds 

11 

14 


a) Elabore un diagrama de dispersión. Coloque las calificaciones de los hombres en el eje hori- 
zontal y las de las mujeres en el eje vertical. 

b) Calcule el coeficiente de correlación por rangos entre las calificaciones de los hombres y las 
mujeres. 

c) A un nivel de significancia de 0.05, ¿es posible concluir que hay una asociación positiva entre 
las dos calificaciones? 
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26. Far West University ofrece clases diurnas y nocturnas en administración. Una pregunta de una 
encuesta a estudiantes intenta saber cómo perciben el prestigio asociado con ciertas carreras. A 
un estudiante diurno se le pidió calificar las carreras de 1 a 8, con 1 como la calificación de mayor 
prestigio y 8 la de menor prestigio. A un estudiante nocturno se le pidió hacer lo mismo. 


Carrera 

Calificación de 
los estudiantes 
diurnos 

Calificación de 
los estudiantes 
nocturnos 

Carrera 

Calificación de 
los estudiantes 
diurnos 

Calificación de 
los estudiantes 
nocturnos 

Contador 

6 

3 

Estadístico 

1 

7 

Programador de computadoras 

7 

2 

Investigador de marketing 

4 

8 

Gerente bancario 

2 

6 

Analista bursátil 

3 

5 

Administrador de hospital 

5 

4 

Gerente de producción 

8 

1 


Encuentre el coeficiente de correlación por rangos de Spearman. 

27. Los nuevos representantes de Clark Sprocket and Chain, Inc., asisten a un breve programa de 
capacitación antes de que se les asigne a una oficina regional de ventas. Al final del programa, el 
vicepresidente de ventas calificó a los representantes respecto dei potencial de ventas futuras. Al 
término del primer año de ventas, sus calificaciones se comparan con sus ventas en ese periodo: 


Representante 

Ventas anuales 
(miles de 
dólares) 

Calificación en 
el programa 
de capacitación 

Kitchen 

319 

3 

Bond 

150 

9 

Gross 

175 

6 

Arbuckle 

460 

1 

Greene 

348 

4 


Ventas anuales 
(miles de 

Representante dólares) 

Calificación en 
el programa 
de capacitación 

Arden 

300 

10 

Crane 

280 

5 

Arthur 

200 

2 

Keene 

190 

7 

Knopf 

300 

8 


a) Calcule e interprete el coeficiente de correlación por rangos entre las ventas en el primer año 
y la calificación después del programa de capacitación. 

b) A un nivel de significancia de 0.05, ¿es posible concluir que hay una asociación positiva entre 
las ventas del primer año y la calificación en el programa de capacitación? 

28. Suponga que la Texas A & M University— Commerce tiene cinco becas disponibles para el equipo 
de basquetbol femenil. El entrenador dio a sus dos asistentes los nombres de 1 0 jugadoras de pre- 
paratoria con potencial para jugar en la universidad. Cada asistente asistió a tres juegos y luego 
calificó a las 10 jugadoras respecto de su potencial. Para explicar lo anterior, el primer asisten- 
te calificó a Norma Tidwell como la mejor jugadora entre las 10 observadas, y a Jeannie Black, 
como la peor. 


Jugadora 

Calificación del asistente 

Jugadora 

Calificación del asistente 

Jean Cann 

John Cannelli 

Jean Cann 

John Cannelli 

Cora Jean Seiple 

7 

5 

Candy Jenkins 

3 

1 

Bette Jones 

2 

4 

Rita Rosinski 

5 

7 

Jeannie Black 

10 

10 

Anita Lockes 

4 

2 

Norma Tidwell 

1 

3 

Brenda Towne 

8 

9 

Kathy Marchal 

6 

6 

Denise Ober 

9 

8 


a) Determine el coeficiente de correlación por rangos de Spearman. 

b) Con un nivel de significancia de 0.05, ¿es posible concluir que hay una asociación positiva 
entre los rangos? 


Resumen del capítulo 
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Resumen del capítulo 

I. La prueba de los signos se basa en la diferencia de signos entre dos observaciones relacionadas. 

A. No es necesario hacer suposiciones acerca de la forma de las dos poblaciones. 

B. Se basa en muestras por pares o dependientes. 

C. En el caso de muestras pequeñas, encuentre el número de signos más (+) o menos (-) y con- 
sulte la distribución binomial para el valor crítico. 

D. En el caso de una muestra de 10 signos más utilice la distribución normal estándar y la siguien- 
te fórmula. 


(X ± .50) - .50 n 
,50Vr? 


( 18 - 2 ) ( 18 - 3 ) 


II. La prueba de la mediana se utiliza para probar una hipótesis acerca de la mediana de una pobla- 
ción. 

A. Encuentre p. y cr de una distribución normal. 

B. Se utiliza la distribución z como el estadístico de prueba. 

C. El valor de z se calcula a partir de la siguiente fórmula, donde X es el número de observaciones 
arriba y debajo de la media. 


(X ± .50) - p, 
cr 


( 18 - 1 ) 


III. La prueba de Wilcoxon de los rangos con signo es una prueba no paramétrica donde no se requie- 
re la suposición de normalidad. 

A. Los datos deben estar al menos en una escala ordinal, y las muestras deben ser dependientes. 

B. Los pasos para realizar la prueba son: 

1. Clasifique las diferencias absolutas entre las observaciones relacionadas. 

2. Aplique el signo de las diferencias a los rangos. 

3. Sume los rangos negativos y los positivos. 

4 . La menor de las dos sumas es el valor T calculado. 

5 . Consulte el apéndice B.7 para el valor crítico y tome una decisión respecto de H 0 . 

IV. La prueba de Wilcoxon de la suma de rangos se usa para probar si dos muestras independientes 
provienen de poblaciones iguales. 

A. No se requiere de una suposición acerca de la forma de la población. 

B. Los datos deben estar al menos en escala ordinal. 

C. Cada muestra debe contener al menos ocho observaciones. 

D. Para determinar el valor del estadístico de prueba 1/1/, las observaciones de las muestras se cla- 
sifican de bajo a alto como si fueran de una sola población. 

E. Se determina la suma de los rangos de cada una de las dos muestras. 

F. 1/1/ se utiliza para calcular z, donde 1/1/ es la suma de los rangos de la primera población. 


1 / 1 / 


n^n-, + n 2 + 1) 


n-¡n 2 (n-¡ + n 2 + 1) 


12 


( 18 - 4 ) 


G. La distribución normal estándar, del apéndice B.1, es el estadístico de prueba. 

V. El análisis de Kruskal-Wallls de la varianza por rangos se usa para probar si varias poblaciones son 
iguales. 

A. No se requieren suposiciones respecto de la forma de las poblaciones. 

B. Las muestras deben ser independientes y al menos de escala ordinal. 

C. Las observaciones de las muestras se clasifican de menor a mayor como si fueran un solo 
grupo. 

D. El estadístico de prueba sigue la distribución ji cuadrada, con la condición de que haya al menos 
5 observaciones en cada muestra. 

E. El valor del estadístico de prueba se calcula a partir de la siguiente fórmula: 


H = 


12 (Sfí^ 2 
n(n + 1 ) L n-¡ 


, (Sfl 2 ) 2 , 

n 2 


(Sñ fc ) 2 

n k 


- 3 (n + 1) 


( 18 - 5 ) 


VI. El coeficiente de correlación por rangos de Spearman es una medida de la asociación entre dos 
variables en escala ordinal. 
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comed 


A. Puede variar de -1 al. 

1. Un valor de 0 indica que no hay asociación entre las variables. 

2 . Un valor de -1 indica una correlación negativa perfecta, y un valor de 1, una correlación 
positiva perfecta. 

B. El valor de r s se calcula a partir de la siguiente fórmula: 


6 2d 2 
n(n 2 - 1) 


(18-6) 


C. Con la condición de que el tamaño de la muestra sea de al menos 10, se puede realizar una 
prueba de hipótesis mediante la siguiente fórmula: 


t = 



(18-7) 


1. El estadístico de prueba sigue la distribución t. 

2 . Hay n — 2 grados de libertad. 


Clave de pronunciación 

SÍMBOLO SIGNIFICADO 

(2R,) 2 Cuadrado del total de los rangos de 

la primera columna al cuadrado 
r s Coeficiente de correlación 

por rangos de Spearman 

ejercicios del capítulo 

29 . La vicepresidente de programación de NBC terminó la programación del horario estelar para el 
otoño. Decidió incluir un drama que se desarrolla en un hospital, pero no está segura sobre cuál 
elegir entre dos posibilidades que se le ofrecen. Tiene un programa piloto llamado “The Surgeon” 
y otro llamado “Critical Care”. Para ayudarla a tomar una decisión, a una muestra de 20 televiden- 
tes de Estados Unidos se les pidió ver los dos programas e indicar cuál prefieren. Los resultados 
fueron que a 12 les gustó “The Surgeon”, a 7 les gustó “Critical Care” y 1 no tuvo preferencia. ¿Hay 
alguna preferencia por uno de los dos programas? Utilice el nivel de significancia 0.10. 

30 . IBM Inc., quiere otorgar un contrato para suministrar bolígrafos de punto fino que se van a utilizar 
en sus oficinas en todo el país. Dos proveedores, Bic y Pilot, presentaron ofertas. Para determinar 
la preferencia de los empleados, corredores y otros interesados, se realiza una prueba de prefe- 
rencia personal con una muestra de 20 empleados seleccionada al azar. Se utilizará un nivel de 
significancia de 0.05. 

a) Si la hipótesis alternativa establece que Bic tiene preferencia en comparación con Pilot, ¿la 
prueba de los signos que se va a realizar es de una o dos colas? Explique su respuesta. 

b) Conforme cada uno de los miembros de la muestra indicó a los investigadores su preferencia, 
se registró un signo “+” para Bic y un ” para el bolígrafo Pilot. Un conteo de los signos más 
reveló que 12 empleados preferían Bic, 5 preferían Pilot y 3 no se decidieron. ¿Cuál es el valor 
de n? 

c) ¿Cuál es su regla de decisión expresada en palabras? 

d) ¿A qué conclusión llegó respecto de la preferencia por los bolígrafos? Explique su respuesta. 

31 . Cornwall and Hudson, importante tienda departamental al menudeo, quiere manejar sólo una 
marca de reproductores de CD de alta calidad. La lista se redujo a dos marcas: Sony y Panasonic. 
Para ayudar a tomar una decisión, se reunió un panel de 16 expertos en audio. Se tocó una pieza 
musical con componentes Sony (identificados como A). Luego se tocó la misma pieza, ahora con 
componentes Panasonic (identificados B). En la siguiente tabla, “+” indica la preferencia de una 
persona por los componentes Sony, indica preferencia por Panasonic y 0 significa que no hay 
preferencia. 


Experto 

1 

2 

3 

4 

5 

6 

7 

8 9 10 11 

12 13 14 15 16 

+ 

- 

+ 

- 

+ 

+ 

- 

0 - + - 

+ + - + 


PRONUNCIACIÓN 

Sigma R subíndice 7 
columna al cuadrado 
r subíndice s 


Realice una prueba de hipótesis con un nivel de significancia de 0.10 para determinar si hay una 
diferencia entre las preferencias por las dos marcas. 
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Turno 

diurno 

Turno 

nocturno 

92 

96 

103 

114 

116 

80 

81 

82 

89 

88 


91 


32 . La Greater Jacksonville, Florida, Real Estate Association afirma que la mediana de la renta de con- 
dominios de tres recámaras es mayor a $1 200 por mes. Una muestra de 149 unidades reveló que 
5 se rentaban exactamente por $1 200 por mes y 75 por más de esa cifra. A un nivel de significan- 
cia de 0.05, ¿es posible concluir que la mediana de la renta es mayor a $1 200 por mes? 

a) Formule H 0 y H-¡. 

b) Establezca la regla de decisión. 

c) Flaga los cálculos necesarios y tome una decisión. 

33 . El Citrus Council of America quiere determinar si los consumidores prefieren jugo de naranja sin 
pulpa o con ella. Se seleccionó una muestra aleatoria de 212 consumidores. Cada miembro de la 
muestra probó un vaso pequeño, sin identificación, de una clase de jugo y luego la otra. Doce 
clientes dijeron que no tenían preferencia, 40 preferían el jugo sin pulpa y al resto le gustó el jugo 
con pulpa. Pruebe con un nivel de significancia de 0.05 que las preferencias por jugo sin pulpa y 
para jugo con pulpa son iguales. 

34 . El objetivo de un proyecto de investigación comunitario es determinar si las mujeres tienen más 
conciencia respecto de la comunidad antes de casarse o después de cinco años de matrimonio. 
Se aplicó una prueba diseñada para medir la conciencia comunitaria a una muestra de mujeres 
solteras, y se les aplicó la misma prueba después de cinco años de matrimonio. Las calificaciones 
de la prueba son: 


Nombre 

Antes de 

casarse 

Después de 
casarse 

Nombre 

Antes de 

casarse 

Después de 
casarse 

Beth 

110 

114 

Carol 

186 

196 

Jean 

157 

159 

Lisa 

116 

116 

Sue 

121 

120 

Sandy 

160 

140 

Cathy 

96 

103 

Petra 

149 

142 

Mary 

130 

139 





Pruebe con un nivel de significancia de 0.05. H 0 es: no hay diferencia en la conciencia comunita- 
ria antes ni después del matrimonio. es: hay una diferencia. 

35 . ¿Hay alguna diferencia entre las tasas de divorcios anuales en condados predominantemente rura- 
les de tres regiones geográficas, suroeste, sureste y noroeste? Pruébelo con un nivel de significan- 
cia de 0.05. Las tasas de divorcio anuales por 1 000 habitantes de los condados seleccionados al 
azar son: 


Suroeste 

5.9, 6.2, 7.9, 8.6, 4.6 

Sureste 

5.0, 6.4, 7.3, 6.2, 8.1, 5.1 

Noroeste 

6.7, 6.2, 4.9, 8.0, 5.5 


36 . El gerente de producción de MPS Audio Systems, Inc., tiene interés en el tiempo de inactividad de 
los trabajadores. En particular le gustaría saber si hay una diferencia entre los minutos inactivos 
de los trabajadores del turno diurno y del turno nocturno. La información a la izquierda es el núme- 
ro de minutos de inactividad del día de ayer de los trabajadores en cinco días a la semana y de los 
trabajadores en seis noches a la semana. Utilice un nivel de significancia de 0.05. 

37 . Los doctores Trythall y Kerns estudian la movilidad de los ejecutivos en ciertas industrias. Su 
investigación mide la movilidad a partir de una calificación basada en el número de veces que un 
ejecutivo se ha mudado, cambiado de compañía o de trabajo durante ios últimos 10 años. El 
mayor número de puntos se otorga a los que se mudan y cambian de compañías, y el menor 
número de puntos a los que cambian de trabajo en la misma compañía sin mudarse. La distribu- 
ción de las calificaciones no sigue la distribución normal de probabilidad. Desarrolle una prueba 
adecuada para determinar si hay una diferencia entre las calificaciones de movilidad en las cuatro 
industrias. Utilice el nivel de significancia 0.05. 


Química 

Detallista 

Internet 

Espacial 

4 

3 

62 

30 

17 

12 

40 

38 

8 

40 

81 

46 

20 

17 

96 

40 

16 

31 

76 

21 


19 
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38. Se formuló una serie de preguntas sobre deportes y sucesos mundiales a un grupo seleccionado 
al azar de ciudadanos naturalizados. Los resultados se convirtieron en las siguientes calificaciones 
de “conocimiento”. 


Ciudadano 

Deportes 

Sucesos mundiales 

Ciudadano 

Deportes 

Sucesos mundiales 

J.C. McCarthy 

47 

49 

L.M. Zaugg 

87 

75 

A.M. Baker 

12 

10 

J.B. Simón 

59 

86 

B.B. Beebe 

62 

76 

J. Goulden 

40 

61 

L.D. Gaucet 

81 

92 

A.A. Fernandez 

87 

18 

C.A. Jones 

90 

86 

A.M. Carbo 

16 

75 

J.N. López 

35 

42 

A.0. Smithy 

50 

51 

A.F Nissen 

61 

61 

J.J. Pascal 

60 

61 


a) Determine el grado de asociación entre cómo calificaron los ciudadanos respecto del conoci- 
miento sobre deportes y cómo calificaron en relación con los sucesos mundiales, 
ib) Con un nivel de significancia de 0.05, ¿es mayor que cero ia correlación de rangos en la pobla- 
ción? 

39. A principios de la temporada de basquetbol, 12 equipos parecen sobresalir. A un panel de comen- 
taristas deportivos y a otro de entrenadores de basquetbol colegial se les pidió calificar a los 12 
equipos. Sus calificaciones compuestas fueron las siguientes: 


Equipo 

Entrenadores Comentaristas deportivos 

Equipo 

Entrenadores 

Comentaristas deportivos 

Duke 

1 

1 

Syracuse 

7 

10 

UNLV 

2 

5 

Georgetown 

8 

11 

Indiana 

3 

4 

Villanova 

9 

7 

North Carolina 

4 

6 

LSU 

10 

12 

Louisville 

5 

3 

St. Johns 

11 

8 

Ohio State 

6 

2 

Michigan 

12 

9 


Determine la correlación entre las calificaciones de los entrenadores y los comentaristas deporti- 
vos. Con un nivel de significancia de 0.05, ¿es posible concluir que hay una correlación positiva 
entre las calificaciones? 

40. El profesor Bert Forman considera que los estudiantes que terminan sus exámenes en el menor 
tiempo posible reciben las calificaciones más altas, y los que tardan más en terminarlos, las más 
bajas. Para verificar su sospecha, asigna una calificación al orden en que terminan los alumnos y 
luego califica los exámenes. Los resultados son los siguientes: 


Estudiante 

Orden en 
que terminó 

Calificación (50 
puntos posibles) 

Gromney 

1 

48 

Bates 

2 

48 

MacDonald 

3 

43 

Sosa 

4 

49 

Harris 

5 

50 

Cribb 

6 

47 


Estudiante 

Orden en 
que terminó 

Calificación (50 
puntos posibles) 

Smythe 

7 

39 

Arquette 

8 

30 

Govito 

9 

37 

Gankowski 

10 

35 

Bonfigilo 

11 

36 

Matsui 

12 

33 


Convierta las calificaciones de los exámenes en un rango y determine el coeficiente de correlación 
por rangos. Con un nivel de significancia de 0.05, ¿es posible que el profesor Forman concluya 
que hay una asociación positiva entre el orden en que terminaron los alumnos los exámenes y las 
calificaciones que obtuvieron? 


Comandos de software 
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Ejercicios de lo base de datos 

41. Consulte los datos de Real State, con información de casas del área de Goodyear, Arizona, duran- 
te el año pasado. 

a) Utilice una prueba no paramétrica apropiada para determinar si hay una diferencia entre los 
precios de venta habituales de las casas en varias colonias. Suponga que los precios de venta 
no están normalmente distribuidos. Utilice el nivel de significancia 0.05. 

b) Clasifique las casas con 6 o más recámaras en un grupo y determine si hay una diferencia de 
acuerdo con el número de recámaras entre los precios de venta habituales de las casas. Utilice 
un nivel de significancia de 0.05 y suponga que la distribución de los precios de venta no está 
normalmente distribuida. 

c) Suponga que la distribución de ia distancia desde el centro de la ciudad tiene un sesgo positi- 
vo. Es decir, no es razonable la suposición de normalidad. Compare la distribución de ia dis- 
tancia desde el centro de la ciudad de las casas que tienen una alberca con las que no la tienen. 
¿Es posible concluir que hay una diferencia entre las distribuciones? Utilice el nivel de signifi- 
cancia 0.05. 

42. Consulte los datos de Baseball 2009, con información sobre la temporada 2009 de la Liga Mayor 

de Béisbol. 

a) Clasifique los equipos por el número de partidos ganados y el salario total del equipo. Calcule 
el coeficiente de correlación por rangos entre las dos variables. Con un nivel de significancia de 
0.01 , ¿es posible concluir que es mayor que cero? 

b) Suponga que las distribuciones de los salarios de ios equipos de la Liga Americana y de la Liga 
Nacional no siguen la distribución normal. Realice una prueba de hipótesis para ver si hay una 
diferencia entre las dos distribuciones. 

c) Clasifique los 30 equipos por asistencia y salario del equipo. Determine el coeficiente de corre- 
lación por rangos entre estas dos variables. Con un nivel de significancia de 0.05, ¿es razona- 
ble concluir que están relacionados ios rangos de estas dos variables? 

43. Consulte los datos sobre los autobuses escolares del Distrito Escolar Buena. 

a) Suponga que la distribución del costo de mantenimiento de tres fabricantes de autobuses no 
sigue una distribución normal. Realice una prueba de hipótesis a un nivel de significancia de 
0.05 para determinar si las distribuciones son diferentes. 

£>) Asuma que la distribución del costo de mantenimiento de la flotilla de autobuses no sigue una 
distribución normal. Realice una prueba de hipótesis a un nivel de significancia de 0.05 para 
determinar si las distribuciones son diferentes. 

c) Suponga que la distribución del costo de mantenimiento de los tipos de autobús, de diesel o 
de gasolina, no sigue una distribución normal. Realice una prueba de hipótesis a un nivel de 
significancia de 0.05 para determinar si las distribuciones son diferentes. 


Comandos de software 


1. Los comandos en MegaStat y Excel para la prueba de 

Wilcoxon de la suma de los rangos de la página 697 son: 

a) Escriba el número de personas que se presentaron para 
Atlanta en la columna A y para Chicago en la columna B. 

b) Seleccione MegaStat, Nonparametric Tests y Wilco- 
xon-Mann/Whitney Test, luego oprima Enter. 

c) Para Group 1, utilice los datos sobre los vuelos de 
Atlanta (B3:B11), y para Group 2, los datos sobre los 
vuelos de Chicago ( D3:D10 ). Haga clic en Correct for 
ties y one-tailed, y less than como alternative; luego 
haga clic en OK. 
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2. Los comandos en Minitab para la prueba de Kruskal-Wallis 

de la página 701 son: 

a) Escriba las calificaciones en la columna 1 y un código 
correspondiente a su grupo en la columna 2. Nombre la 
variable en C1 Scores, y la variable en C2, Group. 

b) En la barra de menú seleccione Stat, Nonparametric y 
Kruskal-Wallis y oprima Enter. 

c) Seleccione las variables Scores como la variable Res- 
ponse y Groups como Factor. 


3. Los comandos en Excel para la ANOVA en una dirección de 

la página 702 son: 

a) Escriba los nombres Manufacturing, Finance y Trade en 
la primera fila, y los datos, en las columnas debajo de 
ellos. 

b) Seleccione Data de la barra de herramientas. Después, 
en el extremo derecho, seleccione Data Analysis y 
ANOVA: Single Factor, y luego haga clic en OK. 

c) En el cuadro de diálogo, el Input Range esA1:C9, haga 
clic en Labels in First Row y escriba El como el Out- 
put Range, luego haga clic en OK. 



Capítulo 18 


Respuestas a las autoevaluaciones 



18-1 a) De dos colas, porque no establece una dirección. 

b) 


18-2 


_ (80 - .50) - .50(1 00) _ 2SL5 

,50\/l0Ü ~ ~5 "" ' 

d) H 0 se rechaza. 

e) La supervisión fue eficaz. 

18-3 H 0 : La mediana < $123, Hp. La mediana es mayor que 
$123. La regla de decisión es rechazar H 0 si z > 1 .65. 


(42 - .50) - 32 = ^5 
.50V64 4 


Y 



Número de éxitos 


(pero sin excederlo), que es la mitad del nivel de signi- 
ficancia. La regla de decisión es rechazar H 0 si el 
número de signos más es 2 o menor, o 10 o mayor, 

c) Rechace H 0 ; acepte H-,. Sí existe una preferencia. 

a) H 0 \ 77 < 0.50, Hp. tt> 0.50. 

b) Rechace H 0 si z > 1 .65. 

c) Como 80 es mayor que n/2 = 100/2 = 50, se emplea: 


Al sumar hacia abajo, 0.000 + 0.003 + 0.016 = 0.019. 
Ésta es la probabilidad acumulada mayor hasta 0.050 


Se rechaza H 0 , debido a que 2.38 es mayor que 1 .65. 
La mediana de la cantidad gastada es mayor a $123. 
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18-4 a) n = 10 (debido a que no hubo cambio para A.A) 

b) 


Antes 

Después 

Dife- 

rencia 

Dife- 

rencia 

abso- 

luta 

Rango 

R~ 

R + 

17 

18 

-i 

1 

1.5 

1.5 


21 

23 

-2 

2 

3.0 

3.0 


25 

22 

3 

3 

5.0 


5.0 

15 

25 

-10 

10 

8.0 

8.0 


10 

28 

-18 

18 

10.0 

10.0 


16 

16 

— 

— 

— 

— 

— 

10 

22 

-12 

12 

9.0 

9.0 


20 

19 

1 

1 

1.5 


1.5 

17 

20 

-3 

3 

5.0 

5.0 


24 

30 

-6 

6 

7.0 

7.0 


23 

26 

-3 

3 

5.0 

5.0 







48.5 

6.5 


H 0 \ La producción es la misma. 

H-¡: La producción aumentó. 

La suma de los rangos con signos positivos es 6.5; la 
suma negativa es 48.5. Del apéndice B.7, prueba de 
una cola, n = 10, el valor crítico es 10. Como 6.5 es 
menor que 10, se rechaza la hipótesis nula y se acepta 
la hipótesis alternativa. Los nuevos procedimientos 
aumentaron la producción. 

c) No es necesaria una suposición respecto de ia forma 
de la distribución. 

18-5 H 0 \ No hay diferencia entre las distancias recorridas por 
XL-5000 y D2. 

H-¡: Hay una diferencia entre las distancias recorridas por 
XL-5000 y D2. 

No rechace H 0 si el valor calculado z aparece entre 1 .96 y 
-1.96 (del apéndice B.1); de lo contrario, rechace H 0 y 
acepte H v n-, = 8, el número de observaciones en la pri- 
mera muestra. 


XL-5000 

D2 


Distancia 

Rango 

Distancia 

Rango 

252 

4 

262 

9 

263 

10 

242 

2 

279 

15 

256 

5 

273 

14 

260 

8 

271 

13 

258 

7 

265 

11.5 

243 

3 

257 

6 

239 

1 

280 

16 

265 

11.5 

Total 

89.5 


46.5 


Rechace H 0 \ acepte H Hay evidencia de una diferen- 
cia en las distancias recorridas por las dos pelotas de 
golf. 


Rangos 

Englewood 

West Side 

Great Northern 

Sylvania 

17 

5 

19 

7 

20 

1 

9.5 

11 

16 

3 

21 

15 

13 

5 

22 

9.5 

5 

2 

14 

8 

18 



12 


2/-?! = 89 Sfí 2 =16 2fí 3 = 85.5 2fí 4 = 62.5 

n 1 = 6 n 2 = 5 n 3 = 5 n 4 = 6 

H 0 : Las distribuciones de las poblaciones son 
idénticas. 

/+,: Las distribuciones de las poblaciones no son 
idénticas. 

■ ■ 12 f (89) 2 f (16) 2 f (85. 5) 2 f (62.5) 2 ' 

22(22 + 1 ) 1 . 6 5 5 6 

- 3(22 + 1) 

= 13.635 

El valor crítico de/c-1 = 4-1 = 3 grados de liber- 
tad es 11.345. Como el valor calculado de 13.635 es 
mayor que 1 1 .345, se rechaza la hipótesis nula. Con- 
clusión: los índices de movimientos no son iguales. 

18-7 a) 


X 

Y 

Rangos 

X Y 

d 

d 2 

805 

23 

5.5 

1 

4.5 

20.25 

777 

62 

3.0 

9 

-6.0 

36.00 

820 

60 

8.5 

8 

0.5 

0.25 

682 

40 

1.0 

4 

-3.0 

9.00 

777 

70 

3.0 

10 

-7.0 

49.00 

810 

28 

7.0 

2 

5.0 

25.00 

805 

30 

5.5 

3 

2.5 

6.25 

840 

42 

10.0 

5 

5.0 

25.00 

777 

55 

3.0 

7 

-4.0 

16.00 

820 

51 

8.5 

6 

2.5 

6.25 





0 

193.00 


6(193) 

10(99) 


-.170 


b) H 0 \ p = 0; H-¡: p A 0. Rechace H 0 s\t< -2.306 o bien 
t > 2.306. 


1/1/ = 89.5 


89.5 - 8(8 + 8 + 1) 
2 

/ ( 8)(8)(8 + 8 + T 

V 12 


21.5 

9.52 


2.26 


( - -W iT-'o.L r -° 488 

H 0 no se rechaza. No se demostró una relación entre 
las dos pruebas. 
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Repaso de los capítulos 17 y 18 

En los capítulos 17 y 18 se describieron métodos estadísticos para estudiar datos en escala nominal u 
ordinal de medición. Estos métodos son estadísticos no paramétrícos o sin distribución. No requieren 
suposiciones respecto de la forma de la población. Recuerde, por ejemplo, del capítulo 12, que cuan- 
do investigó las medias de varias poblaciones supuso que las poblaciones seguían la distribución de 
probabilidad normal. 

En el capítulo 17 se describió la distribución ji cuadrada, que utilizó para comparar el conjunto 
observado de frecuencias en una muestra aleatoria con el conjunto correspondiente de frecuencias 
esperadas en la población. El nivel de medición es de escala nominal. Recuerde que cuando los datos 
se miden en un nivel nominal, las observaciones sólo se clasifican de acuerdo con alguna identifica- 
ción, nombre o característica. Por ejemplo, los 126 representantes nacionales de ventas de IBM se cla- 
sifican de acuerdo con la oficina de ventas regionales a la cual están asignados: noreste, Atlántico 
medio, sureste, norte, centro, suroeste y oeste lejano. 

En el capítulo 17 también estudió la relación entre dos variables en una tabla de contingencia. Es 
decir, observó dos características de cada individuo u objeto muestreado. Por ejemplo, ¿hay alguna 
relación entre la calidad del producto (aceptable o inaceptable) y el turno en que se fabricó (diurno, ves- 
pertino o nocturno)? La distribución ¡i cuadrada es el estadístico de prueba. 

En el capítulo 18 se describieron cinco pruebas no paramétricas de hipótesis y el coeficiente de 
correlación por rangos. Cada una de estas pruebas requiere la escala de medición ordinal, es decir, la 
capacidad de clasificar u ordenar las variables de interés. 

La prueba de los signos para muestras dependientes se basa en el signo de la diferencia entre 
observaciones relacionadas. La distribución nominal es el estadístico de prueba. En los casos donde 
la muestra es mayor que 10, la aproximación normal a la distribución de probabilidad binomial sirve 
como el estadístico de prueba. 

El primer paso cuando se utiliza la prueba de la mediana es contar el número de observaciones 
arriba (o debajo) de la mediana propuesta. Luego se empleó la distribución normal estándar para deter- 
minar si este número es razonable o demasiado grande para haber ocurrido por azar. 

La prueba de Wilcoxon de los rangos con signo requiere muestras dependientes. Es una extensión 
de la prueba de los signos pues emplea tanto la dirección como la magnitud de la diferencia entre los 
valores relacionados. Tiene su propia distribución muestral, que se reporta en el apéndice B.7. 

La prueba de Wilcoxon de la suma de los rangos supone poblaciones independientes, pero no 
requiere que las poblaciones sigan la distribución de probabilidad normal. Una alternativa es la prueba 
t para muestras independientes, descrita en el capítulo 1 1 . Cuando hay al menos ocho observaciones 
en cada muestra, el estadístico de prueba es la distribución normal estándar. 

La prueba de Kruskal-Wallis es una extensión de la prueba de Wilcoxon de la suma de los rangos, 
en el sentido de que maneja más de dos poblaciones. Es una alternativa al método de la ANOVA en 
una dirección, descrito en el capítulo 12. No requiere que las poblaciones sigan la distribución de pro- 
babilidad normal, o que las poblaciones tengan desviaciones estándares iguales. 

El estadístico, coeficiente de correlación por rangos de Spearman, es un caso especial del coefi- 
ciente de correlación de Pearson, descrito en el capítulo 13. Se basa en la correlación entre los rangos 
de observaciones relacionadas. Puede variar de -1.00 a 1.00, en donde 0 indica que no hay asocia- 
ción entre los rangos. 


Glosario 


Capítulo 17 

Distribución ji cuadrada Es una distribución con estas carac- 
terísticas: 1) su valor sólo puede ser positivo. 2) Hay una familia 
de distribuciones ji cuadrada, una diferente por cada grado de 
libertad distinto. 3) Las distribuciones tienen sesgo positivo, 
pero, a medida que aumenta el número de grados de libertad, la 
distribución se aproxima a la distribución normal. 

Nivel de medición nominal Nivel “más bajo” de medición. 
Estos datos sólo se clasifican en categorías, sin un orden par- 
ticular de ellas. Por ejemplo, no hay ninguna diferencia si las 
categorías “hombre” y “mujer” se listan en ese orden, o primero 
mujer y luego hombre. Las categorías son mutuamente excluyen- 
tes, lo que quiere decir, en esta ilustración, que una persona no 
puede ser un hombre y una mujer al mismo tiempo. 

Prueba de bondad de ajuste ji cuadrada Prueba con el obje- 
tivo de determinar el ajuste de un conjunto observado de fre- 


cuencias a un conjunto esperado de frecuencias. Se relaciona 
con una variable de escala nominal, como el color de un auto- 
móvil. 

Pruebas no paramétricas o sin distribución Pruebas de hipó- 
tesis que comprenden datos de nivel nominal u ordinal. No es 
necesario hacer suposiciones acerca de la forma de la distribu- 
ción de la población; es decir, no se supone que la población 
está normalmente distribuida. 

Tabla de contingencia Si dos características, como el género 
y el grado más alto otorgado a una muestra de corredores de 
bolsa, se clasifican en forma cruzada en una tabla, el resultado 
se denomina tabla de contingencia. El estadístico de prueba ji 
cuadrada se utiliza para investigar si las dos características están 
relacionadas. 


Problemas 
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Capítulo 18 

Análisis de la varianza en una dirección de los rangos de 
Kruskal-Wallis Prueba que se utiliza cuando no se pueden 
cumplir las suposiciones del análisis de la varianza (ANOVA) 
paramétrico. Su propósito es probar si varias poblaciones son 
iguales. Los datos deben estar al menos en escala ordinal. 
Coeficiente de correlación por rangos de Spearman Medida 
de la asociación entre los rangos de dos variables. Puede va- 
riar de -1.00 a 1.00. Un valor de -1.00 indica una asociación 
negativa perfecta entre los rangos, y un valor de 1 .00, una aso- 
ciación positiva perfecta entre los rangos. Un valor de 0 indica 
que no hay asociación entre los rangos. 

Prueba de los signos Prueba para muestras dependientes, 
que se utiliza para determinar si hay una preferencia por una 
marca entre dos productos o si es mejor el desempeño después 


de un experimento que antes de él. Además, la prueba de los sig- 
nos se utiliza para probar una hipótesis respecto de la mediana. 
Prueba de Wilcoxon de la suma de los rangos Prueba no 
paramétrica que requiere muestras independientes. Los datos 
deben estar al menos en nivel ordinal. Es decir, deben ser sus- 
ceptibles de clasificación. La prueba se utiliza cuando no se 
cumplen las suposiciones de la prueba t Student paramétrica. El 
objetivo de la prueba es determinar si dos muestras indepen- 
dientes provienen de la misma población. 

Prueba de Wilcoxon de los rangos con signo Prueba no 
paramétrica que requiere al menos datos de nivel ordinal y mues- 
tras dependientes. Su propósito es encontrar una diferencia 
entre dos conjuntos de observaciones apareadas (relacionadas 
por pares). Se usa si no se cumplen las suposiciones que requie- 
re la prueba t por pares. 


Problemas 


1. El propietario de Beach Front Snow Cones, Inc., considera que la mediana del número de conos 
de nieve que vende por día entre el Memorial Day y el Labor Day es 60. La siguiente es una mues- 
tra de 20 días. ¿Es razonable concluir que la mediana en realidad es mayor que 60? Utilice un nivel 
de significancia de 0.05. 


65 

70 

65 

64 

66 

54 

68 

61 

62 

67 

65 

50 

64 

55 

74 

57 

67 

72 

66 

65 


2. Un fabricante de impermeables para niños quiere saber si éstos tienen preferencia por un color 
específico. La siguiente información es sobre la preferencia del color de una muestra de 50 niños 
de 6 y 10 años de edad. Para investigar esta cuestión utilice un nivel de significancia de 0.05. 


Color 

Frecuencia 

Azul 

17 

Rojo 

8 

Verde 

12 

Amarillo 

13 


3. ¿Hay alguna diferencia (en pies) entre las longitudes de los puentes colgantes de las zonas del nor- 
este, sureste y oeste de Estados Unidos? Realice una prueba de hipótesis adecuada con base en 
los siguientes datos. No suponga que las longitudes de los puentes siguen una distribución de pro- 
babilidad normal. Utilice un nivel de significancia de 0.05. 


Noreste 

Sureste 

Oeste 

3 645 

3 502 

3 547 

3 727 

3 645 

3 636 

3 772 

3 718 

3 659 

3 837 

3 746 

3 673 

3 873 

3 758 

3 728 

3 882 

3 845 

3 736 

3 894 

3 940 

3 788 


4 070 

3 802 


4 081 
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CAPÍTULO 18 Métodos no paramétrícos: análisis de datos ordenados 


Casos 


A. El Century National Bank 

¿Hay alguna relación entre la ubicación de la sucursal bancaria y 
el hecho de que un cliente tenga una tarjeta de débito? Con base 
en la información disponible, elabore una tabla que muestre la 
relación entre estas dos variables. Con un nivel de significancia 
de 0.05, ¿es posible concluir que hay una relación entre la ubica- 
ción de la sucursal y un cliente con tarjeta de débito? 

B. Thomas Testing Labs 

John Thomas, propietario de Thomas Testing, durante cierto 
tiempo trabajó como contratista para compañías de seguros en 
lo que concierne a los conductores en estado de ebriedad. Para 
mejorar sus capacidades de investigación, hace poco compró el 
Rupple Driving Simulator. Este dispositivo permite que un sujeto 
haga una “prueba del camino” y proporciona una calificación que 
indica el número de errores de conducción cometidos durante la 
prueba de manejo. Las calificaciones más altas indican más erro- 
res, por ejemplo, no detenerse por completo en una señal de 
alto, no utilizar las señales de vuelta, no tener precaución en el 
pavimento húmedo o con nieve, etc. Durante la prueba del cami- 
no, los problemas aparecen al azar, y no se presentan todos los 
problemas en cada prueba del camino. Éstas son ventajas 
importantes para el Rupple Driving Simulator debido a que los 
sujetos no tienen ventaja al realizar la prueba varias veces. 

Con el nuevo simulador de conducción, Thomas quiere 
estudiar con detalle el problema de la conducción en estado de 
ebriedad. Inicia con una selección de una muestra aleatoria de 25 
conductores, y pide a cada individuo seleccionado tomar la prue- 
ba de conducción en el simulador. En la siguiente tabla se regis- 
tra el número de errores de cada conductor. Luego, pide a cada 
integrante del grupo que beba tres latas de 16 onzas de cerveza 
en un periodo de 60 minutos y regrese al simulador para hacer 
otra prueba de conducción. En la tabla también se muestra el 
número de errores después de beber la cerveza. La pregunta de 


la Investigación es: ¿Afecta el consumo de alcohol la habilidad 
del conductor y, por lo tanto, aumenta el número de errores de 
conducción? 

Thomas considera que la distribución de las calificaciones 
en la prueba de manejo no sigue una distribución normal, y, en 
consecuencia, deberá utilizar una prueba no paramétrica. Como 
las observaciones son apareadas, decide emplear las pruebas de 
los signos y de Wilcoxon por rangos con signo. 


Errores de conducción 

Errores de conducción 

Sujeto 

Sin 

alcohol 

Con 

alcohol 

Sujeto 

Sin 

alcohol 

Con 

alcohol 

1 

75 

89 

14 

72 

106 

2 

78 

83 

15 

83 

89 

3 

89 

80 

16 

99 

89 

4 

100 

90 

17 

75 

77 

5 

85 

84 

18 

58 

78 

6 

70 

68 

19 

93 

108 

7 

64 

84 

20 

69 

69 

8 

79 

104 

21 

86 

84 

9 

83 

81 

22 

97 

86 

10 

82 

88 

23 

65 

92 

11 

83 

93 

24 

96 

97 

12 

84 

92 

25 

85 

94 

13 

80 

103 





a) Compare los resultados que se obtuvieron con los dos pro- 
cedimientos. Realice una prueba apropiada de hipótesis 
para determinar si el alcohol se relaciona con errores al con- 
ducir. 

ib) Redacte un reporte acerca de sus resultados. 


Test de práctica 

Parte 1: Objetivo 

1. Se requiere un nivel de medición para la prueba de bondad de ajuste ji cuadrada. 1. 

2. ¿Cuál de los siguientes no es una característica de la distribución ji cuadrada? (Sesgo positivo, basada en grados de libertad, 

no puede ser negativa, cuando menos 30 observaciones.) 2. 

3 . En una tabla de contingencia, ¿cuántas colas de cada variable se consideran? 3 . 

4 . En una tabla de contingencia, hay cuatro filas y tres columnas; por lo tanto, hay grados de libertad. 

4 

5. En una prueba de bondad de ajuste, el valor crítico de ji cuadrada se basa en (Tamaño de la muestra, número de cate- 
gorías, número de variables o ninguna de las anteriores.) 5. 

6 . En una prueba de signos, ¿las muestras son dependientes o independientes? 6 . 

7 . En una prueba de signos de ocho observaciones apareadas, el estadístico de prueba es la distribución (Binomial, z, t 

o ji cuadrada.) 7 . 

8. ¿Cuál es la diferencia principal entre la prueba de Kruskal-Wallis y la de suma de los rangos de Wilcoxon? (Una se basa en mues- 

tras dependientes y la otra en muestras independientes, uno sirve para comparar dos muestras independientes y la otra para 
comparar dos o más muestras independientes.) 8. 

9. ¿Bajo qué condiciones puede el coeficiente de rango de correlación ser menor a -1 .00? 9. 

10 . La prueba de Kruskal-Wallis se utiliza en vez de la ANOVA cuando no se cumple uno de los siguientes criterios: (población nor- 
mal, desviaciones estándar normales, más de 12 elementos en la muestra, las poblaciones son independientes.) 

10 


Test de práctica 


719 


Parte 2: Problemas 

Utilice el procedimiento de la prueba estándar de hipótesis de cinco pasos. 

1 . Un reciente reporte de censo indicó que 65% de las familias tienen a ambos padres presentes, 20% sólo a la madre, 1 0% sólo al 
padre, y 5% no tienen padres presentes. Una muestra aleatoria de 200 niños de un gran distrito escolar rural reveló lo siguiente: 


Ambos padres 

Sólo madre 

Sólo padre 

Sin padres 

Total 

120 

40 

30 

10 

200 


¿Existe suficiente evidencia para concluir que la proporción de familias por tipo de padre presente en este distrito escolar en par- 
ticular difieren de las reportadas en el censo? 

2. Un editor de libros quiere investigar el tipo de libros que eligen los hombres y las mujeres como lectura de entretenimiento. Una 
muestra aleatoria proporcionó la siguiente información. A un nivel de significancia de 0.05, ¿puede concluir que el género está 
relacionado con el tipo de libro elegido? 



Misterio 

Romance 

Autoayuda 

Total 

Hombres 

250 

100 

190 

540 

Mujeres 

130 

170 

200 

500 


3. Un instructor tiene tres secciones de estadística básica. A continuación se presentan las calificaciones del primer examen de 
cada sección. Asuma que las distribuciones no siguen una distribución de probabilidad normal. A un nivel de significancia 
de 0.05, ¿hay diferencia entre las distribuciones de calificaciones? 


8 a.m. 

10 a.m. 

1:30 p.m. 

68 

59 

67 

84 

59 

69 

75 

63 

75 

78 

62 

76 

70 

78 

79 

77 

76 

83 

88 

80 

86 

71 


86 



87 



Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 

OA1 Analizar la función del 
control de calidad en 
operaciones de producción y 
servicio. 

OA2 Explicar las dos causas 
de la variación de los 
procesos. 

OA3 Utilizar el diagrama de 
Pareto para Identificar causas 
de variación. 

OA4 Construir e Interpretar 
un diagrama de esqueleto de 
pez. 

OA5 Comparar un atributo 
con una medida de calidad 
variable. 

OA6 Calcular los límites 
superior e Inferior de control 
de gráficas medias y de rango. 

OA7 Comparar las gráficas 
de calidad bajo control y fuera 
de control. 

OA8 Construir e interpretar 
un porcentaje defectuoso y 
una gráfica de barras c. 

OA9 Analizar el muestreo de 
aceptación. 

OAIO Describir una curva 
característica de operación de 
varios planes de muestreo. 



Control estadístico del 
proceso y administración 
de calidad 



Cada día, un fabricante de bicicletas selecciona al azar 10 cuadros y 
realiza pruebas para detectar defectos. El número de cuadros 
defectuosos determinado durante los últimos 1 4 días es 3, 2, 1 , 3, 2, 2, 
8, 2, 0, 3, 5, 2, 0 y 4. Elabore el diagrama de control de este proceso y 
comente si está “bajo control”. (Vea ejercicio 1 1 , objetivo 2.) 


19.2 Breve historia del control de calidad 
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19.1 Introducción 

A lo largo de este libro se han presentado muchas aplicaciones de las pruebas de hipótesis. 
En el capítulo 10 se describieron métodos para probar una hipótesis respecto de un valor 
único de la población; en el capítulo 11 fueron métodos para probar una hipótesis acerca de 
dos poblaciones. En éste se presenta otra aplicación, distinta de la prueba de hipótesis, deno- 
minada control estadístico del proceso ( statiscal process control , SPC). 

El control estadístico del proceso está conformado por un grupo de estrategias, técnicas 
y acciones de una organización para asegurar que fabrica un producto o proporciona un ser- 
vicio de calidad. SPC se inicia en la etapa de planeación del producto o servicio, cuando se 
especifican los atributos de ambos, y continúa en la etapa de producción. Cada atributo 
durante el proceso contribuye a incrementar la calidad general del producto. Para un uso efi- 
caz del control de calidad, se desarrollan atributos y especificaciones mensurables con las 
cuales se comparan los atributos reales del producto o servicio. 


19.2 Breve historia del control de calidad 

Antes del siglo xx, la industria estadounidense se caracterizaba por tiendas pequeñas que 
hacían productos relativamente simples, como velas o muebles. En estas tiendas, el trabaja- 
dor era un artesano totalmente responsable de la calidad del trabajo. El trabajador podía ase- 
gurar la calidad mediante la selección personal de los materiales, su habilidad en la 
fabricación, colocación y ajuste selectivos. 

A principios del siglo xx comenzaron a surgir las fábricas, donde se alineaban personas 
con capacitación limitada en largas líneas de ensamblado. Los productos se hicieron mucho 
más complejos. El trabajador ya no tenía el control total de la calidad del producto. Un grupo 
de personal semiprofeslonal, en general llamado departamento de Inspección, se responsabi- 
lizaba de la calidad del producto. En general, la responsabilidad por la calidad se lograba 
mediante una inspección de todas las características importantes. Si había alguna discrepan- 
cia, el supervisor del departamento de manufactura se encargaba del problema. En esencia, 
la calidad se lograba “con la Inspección de la calidad del producto”. 

Durante la década de 1920, el doctor Walter A. Shewhart, de Bell Telephone Laboratories, 
desarrolló los conceptos del control estadístico de la calidad. Introdujo la ¡dea de “controlar” 
la calidad de un producto a medida que se fabricaba, en lugar de inspeccionar la calidad del 
producto terminado. Para controlar la calidad, Shewhart desarrolló técnicas de representación 
para controlar las operaciones de la manufactura en proceso. Además, introdujo el concepto 
de inspección estadística de la muestra para estimar la calidad de un producto a medida que 
se fabricaba. Este enfoque reemplazó el método anterior de inspeccionar cada parte después 
de finalizar el proceso productivo. 

El reconocimiento pleno del control estadístico de la calidad ocurrió durante la Segunda 
Guerra Mundial. La necesidad de producir artículos bélicos en masa, como visores de bom- 
bardeo, radares precisos y demás equipo electrónico con el menor costo posible, aceleró el 
uso del muestreo estadístico y de las tablas de control de calidad. Desde entonces, estas téc- 
nicas estadísticas se refinaron y perfeccionaron. El uso de computadoras también amplió la 
aplicación de dichas técnicas. 

Virtualmente, la Segunda Guerra Mundial destruyó la capacidad de producción japonesa. 
Sin embargo, en lugar de rediseñar los métodos de producción anteriores, los japoneses con- 
siguieron la ayuda del ahora fallecido doctor W. Edwards Demlng, del Departamento de 
Agricultura de Estados Unidos, para elaborar un plan global. En una serle de seminarlos con 
planificadores japoneses, destacó la filosofía que en la actualidad se conoce como los 1 4 pun- 
tos de Demlng. Estos 14 puntos se presentan en la siguiente página. El doctor Edwards recal- 
có que la calidad tiene su origen en la mejora del proceso, no en la inspección, y que son los 
clientes quienes determinan la calidad. El fabricante debe adquirir capacidad, por medio de 
una investigación de mercado, de anticipar las necesidades de los clientes. La gerencia gene- 
ral tiene la responsabilidad de hacer mejoras de largo plazo. Otro de sus puntos, al que los 
japoneses respaldan en gran medida, es que cada miembro de la compañía debe contribuir a 
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la mejora de largo plazo. Para lograr este objetivo, es necesario implementar una educación y 
capacitación continuas. 

Demlng tenía algunas ¡deas que no concordaban con las filosofías contemporáneas de la 
administración en Estados Unidos. Dos áreas donde sus ideas diferían de la perspectiva admi- 
nistrativa en Estados Unidos fueron las cuotas de producción y las clasificaciones de excelen- 
cia. Afirmó que estas dos prácticas, comunes en ese país, no eran productivas y se debían 
eliminar. También señaló que en Estados Unidos los gerentes tienen mucho interés en recibir 
buenas noticias. Sin embargo, éstas no dan oportunidad de mejorar. Por otro lado, las malas 
noticias abren la puerta para nuevos productos y permiten que la compañía mejore. 

A continuación se resumen los 14 puntos del doctor Deming, quien afirmaba de manera 
categórica que debían adoptarse como un paquete para tener éxito. El tema es la coopera- 
ción, el trabajo en equipo y la convicción de que los trabajadores quieren que su trabajo sea 
de calidad. 


0A1 Analizar la función del 
control de calidad en opera- 
ciones de producción y 
servicio. 


LOS 14 PUNTOS DE DEMING 

1. Crear un propósito constante de mejora continua de productos y servicio para la 
sociedad. 

2. Adoptar la filosofía de que ya no es posible vivir con los niveles de retrasos, erro- 
res, materiales defectuosos y mano de obra deficiente comúnmente aceptados. 

3. Eliminar la necesidad de la Inspección masiva como manera de lograr calidad. Para 
obtenerla se debe fabricar el producto en forma correcta desde el principio. 

4. Terminar con la práctica de ganar negocios sólo con base en el precio: es necesa- 
rio incluir medidas de calidad significativas junto con él. 

5. Mejorar de manera constante y por siempre cada proceso de planeación, produc- 
ción y servicio. 

6. Implementar métodos modernos de capacitación en el trabajo para todos los 
empleados, incluso para los administradores. Esto generará un mejor aprovecha- 
miento de cada empleado. 

7. Adoptar e instituir un liderazgo dirigido a ayudar a la gente para que haga un mejor 
trabajo. 

8. Fomentar la comunicación bidireccional eficaz y otros medios para ahuyentar el 
miedo en la organización, de modo que todos trabajen de manera más eficiente y 
productiva para la compañía. 

9. Romper las barreras entre los departamentos y las áreas de personal. 

10. Eliminar el uso de lemas, carteles y exhortaciones que exijan cero defectos y nue- 
vos niveles de productividad sin proporcionar los métodos para lograrlos. 

1 1 . Eliminar los estándares de trabajo que fijan cuotas para la fuerza de trabajo y 
metas numéricas para el personal administrativo. Sustituir los apoyos y el liderazgo 
conveniente a fin de lograr una mejora permanente en la calidad y la productividad. 

12. Eliminar las barreras que roban a los jornaleros y al personal administrativo su dere- 
cho a enorgullecerse del fruto de su trabajo. 

13. Instituir un programa educativo riguroso y fomentar la superación personal de 
todos. Lo que una organización necesita es buen personal que se supere con la 
educación. El ascenso a un puesto competitivo tendrá sus raíces en el conoci- 
miento. 

14. Definir con claridad el compromiso permanente de la administración para mejorar la 
calidad y la productividad y aplicar todos estos principios. 

V J 


Los 14 puntos de Deming no Ignoraron el control estadístico de la calidad, que con fre- 
cuencia se abrevia SQC, por sus siglas en Inglés. El objetivo del control estadístico de la cali- 
dad es supervisar la producción en muchas etapas de la manufactura. Se emplean las 
herramientas del control estadístico de la calidad, como las gráficas de barras X y R, para 
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supervisar la calidad de muchos procesos y servicios. Las tablas de con- 
trol permiten identificar cuándo un proceso o servicio está “fuera de 
control”, es decir, cuándo llega el momento en el que se produce un núme- 
ro excesivo de unidades defectuosas. 

El interés en la calidad se aceleró de forma impresionante en Estados 
Unidos desde finales de la década de 1980. Encienda la televisión y vea 
los comerciales de Ford, Nissan y GM donde destacan el control de cali- 
dad en sus líneas de ensamble. En la actualidad es uno de los temas “de 
moda” en todas las facetas de los negocios. V. Daniel Hunt, un connotado 
asesor estadounidense en control de calidad, reporta que en la actualidad, 
en Estados Unidos, de 20 a 25% del costo de producción se gasta en 
detectar y corregir errores. Además, agrega que el costo adicional de repa- 
rar o reemplazar productos defectuosos sobre la marcha ocasiona que 
el costo total de la calidad deficiente sea de casi 30%. En Japón, indicó, 
este costo es de apenas 3 por ciento. 

En años recientes, las compañías se motivaron para mejorar la calidad 
en un esfuerzo por obtener reconocimiento en este renglón. El Malcolm 
Baldrige National Quality Award, establecido en 1988, se otorga anualmente a compañías 
estadounidenses que demuestren excelencia en el logro y administración de la calidad. Las 
categorías del premio son manufactura, servicios, negocios pequeños, cuidado de la salud y 
educación. Los ganadores de años recientes fueron, entre otros, Xerox, IBM, la University of 
Wisconsin-Stout, Ritz-Carlton Hotel Corporation, Federal Express y Cadillac. Los ganadores 
en 2009 fueron: 



Estadística en acción 

¿La excelencia en la 
administración de la cali- 
dad permite un mejor 
desempeño financiero? 
En una investigación 
reciente se comparó el 
desempeño financiero de 
las compañías que reci- 
bieron el Baldrige 
National Quality Award 
con compañías similares 
que no fueron premiadas. 
La investigación reveló 
que las compañías que lo 
recibieron tenían un pro- 
medio de 39% de ingreso 
operativo más alto y 26% 
más ventas, y su costo por 
dólar de venta fue 1.22% 
menor. 



• Honeywell Federal Manufacturing & Technologies, LLC (FM&T) resultó ganadora en la 
categoría de manufactura. Es una de las más versátiles empresas de bajo volumen y alta 
confiabilidad en la producción en Estados Unidos, que da servicio a agencias guberna- 
mentales, laboratorios nacionales, universidades e industrias en aquel país. El índice 
general de satisfacción del cliente con la compañía llegó a o por encima de 95% durante 
los pasados cuatro años, lo que la compara favorablemente con otras empresas simila- 
res, cuyos niveles oscilaron de 78 a 85% en el mismo periodo. 

• AtlantiCare fue uno de los ganadores de 2009 en la categoría de cuidado de la salud. La 
organización es un sistema de salud no lucrativo del sureste de Nueva Jersey, que pro- 
porciona cuidados a enfermos agudos y crónicos, servicios preventivos y a pacientes en 
riesgo, e información sobre la salud. Entre otros logros, las encuestas de 2007 a 2009 
muestran que los resultados de satisfacción del cliente estuvieron por encima de 90° per- 
centil del punto de referencia nacional, lo que incluye a los correspondientes a centro qui- 
rúrgico, el instituto de la columna vertebral, urgencias y laboratorios clínicos. 

• MidwayUSA recibió el premio en la categoría de pequeñas empresas. La firma es un nego- 
cio familiar, dedicada a la venta al menudo por catálogo e internet que ofrece productos 
para realizar disparos, recarga, armería y cacería. Los clientes al menudeo representan 
90% del negocio total de la firma, y los distribuidores y clientes internacionales el resto. 
La compañía distribuye más de 95 000 productos distintos de más de 700 proveedores. 
Al concentrar sus procesos en el servicio al cliente, la firma mejoró su nivel general de 
satisfacción del cliente, de 91 % en 2007 y 2008 a 93% en 2009. 

• Con sede en St. Joseph, Missouri, Heartland Health recibió el premio 2009 en la catego- 
ría de cuidado de la salud. Heartland Health es un sistema de salud integral, no lucrativo, 
con base en la comunidad, que da servicio a los residentes del noroeste de Missouri, nor- 
este de Kansas, sureste de Nebraska y suroeste de lowa. Con más de 3 200 prestadores 
de servicios de salud (empleados, voluntarios y profesionales en cuidado de la salud), 
Heartland Health es el sistema de salud más grande de la región. La organización utiliza 
métodos Six Sigma para lograr una mejora continua. Las mejoras en la reducción de erro- 
res, inspecciones, exámenes y auditorías generaron un ahorro de $8 millones en 2005 que 
se incrementó a más de 25 millones en 2009. 

• El Veterans Affairs Cooperative Studies Program (VACSP: Programa de estudios coopera- 
tivos sobre asuntos de veteranos) del Clinical Research Pharmacy Coordinating Center (el 
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OA2 Explicar las dos causas 
de la variación de los 
procesos. 


Centro) fue el ganador en la categoría de organizaciones no lucrativas. El Centro fabrica, 
empaca, almacena, etiqueta, distribuye y rastrea materiales para pruebas clínicas (fárma- 
cos y dispositivos) y monitorea la seguridad del paciente. Un logro significativo de la com- 
pañía es la retención de clientes. Setenta y cinco por ciento de las relaciones del Centro 
con sus clientes sobrepasan los 10 años. 

Hay más información sobre los ganadores de 2006 y otros ganadores en http://www.quallty. 
nist.gov. 


Six Sigma 

Muchas organizaciones de servicio, manufactura y no lucrativas están comprometidas con la 
mejora de la calidad de sus productos y servicios. “Six Sigma” es el nombre que se le dio a 
un programa organlzaclonal diseñado para mejorar la calidad y el desempeño de la totalidad 
de una corporación. El enfoque del programa se concentra en reducir la variación en cualquier 
proceso que se utilice para producir y entregar productos y servicios a los clientes. Los pro- 
gramas Six Sigma se aplican a procesos de producción así como a procesos contables y otros 
de apoyo organizaclonal. Los últimos resultados de un programa de Six Sigma son reducir los 
costos de los errores y defectos, aumentar la satisfacción del cliente y las ventas de produc- 
tos y servicios, e incrementar los rendimientos. 

Six Sigma obtiene su nombre de la distribución normal. El término sigma significa “des- 
viación estándar”, y “más o menos” tres desviaciones estándar dan un rango total de seis 
desviaciones estándares. Por lo tanto, Six Sigma significa no tener más de 3.4 defectos por 
millón en cualquier proceso, producto o servicio. Muchas empresas se esfuerzan por tener aun 
menos defectos. 

Para lograr esta meta, el programa Six Sigma capacita a cada miembro de la organización 
que participe en los procesos para que puedan identificar las fuentes de variación que afec- 
tan significativamente la calidad. El proceso incluye identificar y definir el problema, mejorar el 
proceso para reducir su variación, e implementar procedimientos para mejorarlo. 

Six Sigma utiliza muchas técnicas estadísticas para recabar y analizar los datos necesa- 
rios para reducir la variación de un proceso. En este libro se incluyen los siguientes: histogra- 
mas, análisis de variación, prueba de ji cuadrada de la independencia, la regresión y la 
correlación. 

General Electric, Motorola y AlliedSignal (en la actualidad parte de Honeywell) son com- 
pañías grandes que utilizan los métodos Six Sigma que lograron una mejora relevante de cali- 
dad y ahorros en costos. Incluso ciudades como Fort Wayne, Indiana, emplean las técnicas 
Six Sigma para mejorar sus operaciones. La ciudad ahorró $10 millones desde 2000 y mejoró 
el servicio a sus clientes. Por ejemplo, redujo 50% la generación de basura y el tiempo de res- 
puesta para reparar baches de 21 a 3 horas. Puede aprender más acerca de las ¡deas, méto- 
dos y capacitación Six Sigma en www.6sigma.us. 


19.3 Causas de variación 

No hay dos productos exactamente ¡guales. Siempre hay alguna variación. El peso de cada 
hamburguesa Quarter Pounder de McDonald's no es exactamente 0.25 libras. Algunas pesan 
más de eso, otras menos. El tiempo estándar para que el autobús de TARTA (Toledo Area 
Regional Transit Authorlty) haga su recorrido desde el centro de Toledo, Ohio, hasta Perrysburg 
es de 25 minutos. Sin embargo, no todos los recorridos tardan exactamente 25 minutos. 
Algunos tardan más. En otras ocasiones, el conductor de TARTA debe esperar en Perrysburg 
antes de regresar a Toledo. En algunos casos existe una razón de la demora, como un acci- 
dente en la vía rápida o una tormenta de nieve. En otros casos, el conductor quizá no alcan- 
ce los semáforos en verde o el tráfico esté inusualmente congestionado y lento sin razón 
aparente. En un proceso hay dos fuentes generales de variación: aleatoria y asignable. 
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OA3 Utilizar el diagrama de 
Pareto para identificar causas 
de variación. 


VARIACIÓN ALEATORIA Variación atribuible al azar. Este tipo de variación no se elimina por 
completo a menos que haya un cambio importante en las técnicas, tecnologías, métodos, 
equipamiento o materiales propios del proceso. 


Algunos ejemplos de fuentes de variación aleatoria son la fricción interna en una máqui- 
na, variaciones ligeras en las condiciones del material o del proceso (como la temperatura del 
molde para hacer botellas de vidrio), condiciones atmosféricas (como temperatura, humedad 
y el contenido de polvo del aire) y vibraciones transmitidas a una máquina por un montacar- 
gas que pasa a su lado. 

Si el agujero taladrado en una pieza de acero es demasiado grande debido a una broca 
sin filo, la broca se debe afilar, o insertar una broca nueva. Un operador que calibra la máqui- 
na de manera incorrecta se puede reemplazar o volver a capacitar. Si el rollo de acero que se 
utilizará en el proceso no tiene la resistencia a la tensión adecuada, se debe rechazar. Éstos 
son ejemplos de variación asignable. 


VARIACIÓN ASIGNABLE Variación que no es aleatoria. Se elimina o reduce cuando se investiga 
el problema y se encuentra la causa. 


Hay varias razones a las que debemos poner atención respecto de la variación. Dos de 
ellas se mencionan a continuación: 

1 . Cambiará la forma, dispersión y ubicación central de la distribución de la característica del 
producto que se mide. 

2. Por lo general, la variación asignable es corregible, en tanto que normalmente la variación 
aleatoria no se puede corregir o estabilizar de manera económica. 


19.4 Diagramas de diagnóstico 

Existen diversas técnicas de diagnóstico para investigar problemas de calidad. Dos de las más 
relevantes son los diagramas de Pareto y los diagramas de esqueleto de pez. 


Diagramas de Pareto 

El análisis de Pareto es una técnica para llevar la cuenta del número de defectos de un pro- 
ducto o servicio. Su nombre le fue impuesto en honor de un científico italiano del siglo XIX, 
Wilfredo Pareto, quien observó que la mayor parte de la “actividad” de un proceso se debe a 
relativamente pocos “factores”. Su concepto, con frecuencia denominado regla 80-20, es que 
80% de la actividad se debe a 20% de los factores. Al concentrarse en 20% de los factores, 
los gerentes pueden dedicarse a 80% del problema. Por ejemplo, Emily’s Family Restaurant, 
ubicado en el cruce de las carreteras interestatales 75 y 70, investiga las “quejas de los clien- 
tes”. Las cinco quejas escuchadas con más frecuencia son: servicio descortés, comida fría, 
larga espera por una mesa, pocas opciones en el menú y niños indisciplinados. Suponga que 
el servicio descortés es lo más frecuente y la comida fría aparece en segundo lugar. Estos dos 
factores representan más de 85% de las quejas, y de aquí que sean los dos que se deben 
atender primero, pues producirán la mayor reducción de las quejas. 

Para elaborar un diagrama de Pareto, inicie con la cuenta del tipo de defectos. Luego, cla- 
sifique los defectos en términos de la frecuencia en que ocurren de mayor a menor. Por últi- 
mo, elabore una tabla de barras verticales, cuya altura corresponda a la frecuencia de cada 
defecto. El siguiente ejemplo ilustra estas ideas. 
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Cjemplo 


Solución 


La administradora de la ciudad de Grave City, Utah, está preocupada por el consumo del agua, 
en particular en los hogares unifamiliares. Le gustaría desarrollar un plan para reducirlo. Para 
investigar este problema, selecciona una muestra de 100 hogares y determina el consumo nor- 
mal de agua diario para diversos fines. Éstos son los resultados de la muestra. 


Consumo de agua 

Galones por día 

Lavandería 

24.9 

Regar el jardín 

143.7 

Baño personal 

106.7 

Cocinar 

5.1 

Alberca 

28.3 

Lavar trastos 

12.3 

Lavar el automóvil 

10.4 

Beber 

7.9 


¿Cuál es el área con mayor consumo? ¿Dónde debe concentrar sus esfuerzos para reducir el 
consumo de agua? 

Un diagrama de Pareto es útil para Identificar las áreas principales de consumo de agua y enfo- 
carse en aquéllas donde se pueda lograr la mayor reducción. El primer paso es convertir 
cada actividad en un porcentaje y luego ordenarlas de mayor a menor. El consumo total de 
agua por día es de 339.3 galones, que se determinó al sumar el total de galones que consu- 
men las ocho actividades. La actividad que consume más es el riego del jardín, que correspon- 
de a 143.7 galones por día, o 42.4% de la cantidad de agua. La siguiente categoría mayor es 
el baño personal, que representa 31.4% del agua. Estas dos actividades representan 73.8% 
del consumo. 


Consumo de agua 

Galones por día 

Porcentaje 

Lavandería 

24.9 

7.3 

Regar el jardín 

143.7 

42.4 

Baño personal 

106.7 

31.4 

Cocinar 

5.1 

1.5 

Alberca 

28.3 

8.3 

Lavar trastos 

12.3 

3.6 

Lavar el automóvil 

10.4 

3.1 

Beber 

7.9 

2.3 

Total 

339.3 

100.0 


Para trazar el diagrama de Pareto, inicie con la representación a escala del número de 
galones que se consumen en el eje vertical izquierdo, y el porcentaje correspondiente en el eje 
vertical derecho. Luego trace una barra vertical con la altura de la barra correspondiente a la 
actividad con el número mayor de eventos. En el ejemplo de Grave City, trace una barra verti- 
cal de la actividad de riego a una altura de 143.7 galones (llamado conteo). Continúe este pro- 
cedimiento con las demás actividades, como se muestra en la captura de pantalla de Minitab 
de la gráfica 19-1 . 

Debajo del diagrama enumere las actividades, su frecuencia y el porcentaje de tiempo en 
que se realizan. En el último renglón liste el porcentaje acumulado. Este renglón acumulado 
permite determinar con rapidez qué conjunto de actividades representa el mayor consumo de 
agua. Estos porcentajes acumulados se trazan arriba de las barras verticales. En el ejemplo 
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OA4 Construir e interpretar 
un diagrama de esqueleto de 
pez. 




* 

C1T 



Usaga 

Gallón* 

i 

Liundaimg 

24 90 

2 

Walonng 

143 70 

3 

Balhavg 

106 70 

4 

Codnng 

$10 

5 

Pool 

26 36 

6 

Dnhwathing 

12 30 

7 

Cor Wtohmg 

10 40 

8 

Onnfcmg 

790 

9 



10 



11 



12 



13 



14 
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C4 
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CS 

-ini x 
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GRAFICA 19-1 Diag rama de Pareto del consumo de agua en Grove City, Utah 


de Grove City, las actividades de riego, baño personal y albercas representan 82.1% del con- 
sumo de agua. La administradora de la ciudad puede lograr una mayor ganancia si reduce el 
uso del agua en estas tres áreas. 


Diagramas de esqueleto de pez 

Otra tabla de diagnóstico es un diagrama de causa y efecto o diagrama de esqueleto de 

pez. Se llama diagrama de causa y efecto para destacar la relación entre un efecto particular 
y un conjunto de causas posibles que lo producen. Este diagrama es útil para organizar ideas 
e identificar relaciones. Es una herramienta que fomenta la generación de ideas. Identificar 
estas relaciones permite determinar factores que son causa de variabilidad en algún proceso. 
El nombre esqueleto de pez proviene de la manera en que se organizan las diversas causas y 
efectos en el diagrama. El efecto, por lo general un problema particular, o tal vez un objetivo, 
se muestra a la derecha del diagrama. Las causas principales se enumeran del lado izquierdo 
del diagrama. 

El enfoque habitual de un diagrama de esqueleto de pez es que permite considerar cua- 
tro áreas del problema: métodos, materiales, equipamiento y personal. El problema, o el efec- 
to, es la cabeza del pez. Consulte la gráfica 19-2. 



GRAFICA 19-2 Diag rama de esqueleto de pez 
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En cada causa posible se encuentran causas derivadas que se deben identificar e inves- 
tigar, las cuales son factores que quizás estén provocando el efecto particular. Se recopila la 
información concerniente al problema y con ella se completa el diagrama de esqueleto de pez. 
Se investiga cada causa y se eliminan las que no son importantes, hasta identificar la causa 
real. 

La gráfica 19-3 ilustra los detalles de un diagrama de esqueleto de pez. Suponga que 
hace poco un restaurante familiar, como los que se encuentran a lo largo de una autopista inte- 
restatal, recibió quejas de los clientes porque les servían la comida fría. Observe que cada 
causa derivada se enumera como suposición, y se deben investigar para encontrar el proble- 
ma real sobre la comida fría. En un diagrama de esqueleto de pez no hay ponderación de las 
causas derivadas. 


Métodos 


Materiales 


Comida calentada a la 
temperatura correcta 


Comida a la temperatura 
inicial correcta 


\ Comida bajo luces 
\ de calefacción 

\ El empaque aísla 
\ lo suficiente 


Quejas 

de 


/ Termostato que trabaja 
/ de manera correcta 

/ Empleados operan 
/ el equipo correctamente 

comida 

fría 

/ Luces de calefacción 
/ a la temperatura correcta 

/ Meseros entregan la 
/ comida de manera rápida 



Equipamiento 


Personal 


GRAFICA 19-3 Diag rama de esqueleto de pez para investigar quejas de comida fría en un restaurante 



Rose Home, al sur de Chicago, es una institución de salud mental. Hace poco hubo quejas sobre 
las condiciones en ella. El administrador quiere utilizar un diagrama de Pareto para investigar la 
situación. Cuando se queja un paciente o familiar, se le pide llenar un formato. El siguiente es el 
resumen de los formatos de quejas de los últimos 12 meses. 


Queja 

Número 

Queja 

Número 

Nada que hacer 

Atención deficiente 

45 

Condiciones insalubres 

63 

del personal 

71 

Mala calidad de los alimentos 

84 

Error en los medicamentos 

2 

Personal irrespetuoso 

35 


Elabore un diagrama de Pareto. ¿Cuáles son las causas que el administrador debe resolver primero 
para lograr la mejora más significativa? 


comect 


Ejercicios 

1. Tom Sharkey es el propietario de Sharkey Chevy, Buick, GMC, Isuzu. A principios del año, Tom 
implemento un programa de opinión de los clientes a fin de determinar formas para mejorar el ser- 
vicio. Una semana después de que se realizó el servicio, el asistente administrativo de Tom llama 
al cliente para averiguar si se efectuó de manera satisfactoria y cómo se puede mejorar. El siguien- 
te es un resumen de las quejas de los primeros seis meses. Elabore un diagrama de Pareto. 
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¿Cuáles son las quejas que le sugeriría a Tom que resolviera primero para mejorar la calidad del 
servicio? 


Queja 

Frecuencia 

Queja 

Frecuencia 

Problema sin corregir 

38 

Precio demasiado alto 

23 

Error en la factura 

8 

Mucho tiempo para 


Ambiente poco sociable 

12 

prestar el servicio 

10 


2. En un taller de reparaciones se descubrió que de 1 1 0 motores que funcionan con diesel, 9 tenían 
bombas de agua con fugas, 15 presentaban cilindros defectuosos, 4 padecían problemas de 
encendido, 52 tenían fugas de aceite y 30 bloques agrietados. Trace un diagrama de Pareto para 
identificar el problema clave de los motores. 


19.5 Objetivo y tipos de diagramas 
de control de calidad 

OA5 Comparar un atributo Los diagramas de control identifican el momento en que entran en el proceso las causas asig- 
con una medida de calidad nables de variación o los cambios. Por ejemplo, Wheeling Company fabrica ventanas de alu- 

variable. minio recubiertas con vinilo para casas antiguas. El recubrimiento de vinilo debe tener un 

espesor comprendido entre ciertos límites. Si es demasiado grueso, provocará que las venta- 
nas se atoren. Por otro lado, si es demasiado delgado, la ventana no sellará bien. El mecanis- 
mo que determina cuánto recubrimiento se pone en cada ventana se desgasta y comienza a 
engrosarlo demasiado. Por lo tanto, ocurrió un cambio en el proceso. Los diagramas de con- 
trol son útiles para detectar el cambio en las condiciones del proceso. Es importante saber 
cuándo se produjeron cambios en el proceso, de modo que la causa se identifique 
y corrija antes de que se produzca un gran número de artículos inaceptables. 

Los diagramas de control se parecen a la pizarra del marcador de un juego de 
béisbol. Al ver la pizarra, los fanáticos, entrenadores y jugadores saben qué equipo 
va ganando. Sin embargo, la pizarra no hace nada para ganar o perder el juego. Los 
diagramas de control tienen una función similar: indican a los trabajadores, líderes 
de grupos, ingenieros de control de calidad, supervisores de producción y gerentes 
si la producción de la parte o el servicio está “bajo control” o “fuera de control”. En 
este último caso, el diagrama de control no solucionará la situación; sólo es una hoja 
de papel con cifras y puntos. En cambio, la persona responsable ajustará la máqui- 
na, fabricará la pieza o hará lo que sea necesario para poner la producción “bajo 
control”. 

Hay dos tipos de diagramas de control. Un diagrama de control de variables 
representa mediciones, como la cantidad de refresco de cola en una botella de dos 
litros o el diámetro exterior de una tubería. Un diagrama de control de variables 
requiere un intervalo o escala de razón de medición. Un diagrama de control de 
atributos clasifica un producto o servicio como aceptable o inaceptable. Se basa 
en la escala de medición nominal. A los infantes de marina estacionados en Camp 
Lejeune se les pide calificar los alimentos que se les sirven como aceptables o 
inaceptables; los préstamos bancarios se pagan o se dejan de pagar. 



Diagramas de control de variables 

Para elaborar diagramas de control de variables se depende de la teoría de muestreo que se 
analizó, junto con el teorema central del límite, en el capítulo 8. Suponga que selecciona una 
muestra de cinco piezas cada hora del proceso de producción y calcula la media de cada 
una. Las medias de la muestra son X-,, X 2 , X 3 , etc. La media de estas medias de las muestras 
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OA6 Calcular los límites de 
control superior e inferior 
para los gráficos de media y 
rango. 


Cjemplo 


se denota como X. Utilice k para indicar el número de medias de la muestra. La media gene- 
ral o media total se determina mediante: 


r 


MEDIA TOTAL 


V 


= _ 2 de las medias de las muestras _ 2X 
Número de medias muéstrales k 


(19-1) 


El error estándar de la distribución de las medias de las muestras se designa mediante s*. Se 
determina por: 


f. I 

ERROR ESTÁNDAR DE LA MEDIA 

V 



\ 

(19-2) 




Estas relaciones permiten establecer límites respecto de las medias de las muestras para 
mostrar cuánta variación se espera en un tamaño determinado de la muestra. Estos límites 
esperados se denominan límite de control superior (LCS) y límite de control inferior (LCI). 
Un ejemplo ilustrará el uso de los límites de control y la forma de determinarlos. 


Statistical Software, Inc., ofrece un número telefónico de larga distancia sin costo al cual los 
clientes pueden llamar todos los días, de 7 a.m. a 11 p.m., para resolver problemas con sus 
productos. Es imposible que un representante técnico conteste de inmediato, pero es impor- 
tante que los clientes no esperen demasiado en línea para que les respondan. Los clientes se 
molestan cuando escuchan demasiadas veces el mensaje: “Su llamada es importante para 
nosotros. En breve le contestará un representante”. Para comprender el proceso, Statistical 
Software decidió elaborar una tabla de control con el tiempo total desde el momento en que se 
recibe una llamada hasta que el representante la responde y soluciona el problema. El día de 
ayer se tomó una muestra de cinco llamadas cada hora durante las 16 horas de operación del 
servicio de atención al cliente. 




Número de muestra 


Hora 

1 

2 

3 

4 

5 

a.m. 7 

8 

9 

15 

4 

11 

8 

7 

10 

7 

6 

8 

9 

11 

12 

10 

9 

10 

10 

12 

8 

6 

9 

12 

11 

11 

10 

6 

14 

11 

p.m. 12 

7 

7 

10 

4 

11 

1 

10 

7 

4 

10 

10 

2 

8 

11 

11 

7 

7 

3 

8 

11 

8 

14 

12 

4 

12 

9 

12 

17 

11 

5 

7 

7 

9 

17 

13 

6 

9 

9 

4 

4 

11 

7 

10 

12 

12 

12 

12 

8 

8 

11 

9 

6 

8 

9 

10 

13 

9 

4 

9 

10 

9 

11 

8 

5 

11 
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Solución 


Con base en esta información, elabore una tabla de control para determinar la duración 
media de la llamada. ¿Parece existir una tendencia en las horas de las llamadas? ¿Hay algún 
periodo donde parece que los clientes esperan más que en otros? 

Una tabla para el control de la media tiene dos límites: un límite de control superior (LCS) y un 
límite de control inferior [LCI). Estos límites de control superior e inferior se calculan mediante: 


LÍMITES 
DE CONTROL 
DE LA MEDIA 


LCS = X+ y 


LCI = X - 3— 

Vñ 


(19-3) 




donde s es una estimación de la desviación estándar de la población, a. Observe que en el 
cálculo de los límites de control superior e inferior aparece el número 3. Representa 99.74% de 
los límites de confianza. Con frecuencia, a los límites se les denomina 3-sigma. Sin embargo, 
se pueden utilizar otros límites de confianza (como 90% o 95%). 

Esta aplicación se desarrolló antes del extenso acceso a las computadoras y era difícil 
calcular las desviaciones estándares. En vez de calcular la desviación estándar de cada mues- 
tra como una medida de variación, es más fácil utilizar el rango. En el caso de muestras de 
tamaño fijo hay una relación constante entre el rango y la desviación estándar, por lo que es 
apropiado utilizar las fórmulas siguientes para determinar 99.74% de los límites de control de 
la media. Se puede demostrar que el término 3 (s/Vn de la fórmula (19-3) equivale a A 2 R en la 
siguiente fórmula. 


^LÍMITES de control 
DE LA MEDIA 


LCS = X + A 2 R 


LCI = X- AnR 


(19-4) 


donde: 

A 2 es una constante al calcular los límites de control superior e inferior. Se basa en el rango 
promedio, R. Los factores de varios tamaños de muestras aparecen en el apéndice B.8. 
(Nota: en esta tabla, n se refiere al número de elementos de la muestra.) A continuación 
se presenta una parte del apéndice B.8. Para ubicar el factor A z de este problema, 
encuentre el tamaño de n en el margen izquierdo, que es 5. Luego continúe con un 
movimiento horizontal hasta la columna A¿ el factor es 0.577. 


n 

a 2 

d 2 

d 3 

0 4 

2 

1.880 

1.128 

0 

3.267 

3 

1.023 

1.693 

0 

2.575 

4 

0.729 

2.059 

0 

2.282 

5 

0.577 

2.326 

0 

2.115 

6 

0.483 

2.534 

0 

2.004 


X es la media de las medias de las muestras, que se calcula mediante 'XX/k, donde k es 
el número de muestras seleccionadas. En este problema se toma una muestra de 5 
observaciones cada hora durante 16 horas, por lo que k = 16. 
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fí es la media de los rangos de la muestra, que es 2fí//c. Recuerde que el rango es la dife- 
rencia entre el valor mayor y el menor de cada muestra, y describe la variabilidad que 
ocurre en esa muestra. (Consulte la tabla 19-1 .) 

TABLA 19-1 Duración de 16 muestras de cinco sesiones de ayuda 


Hora 

1 

2 

3 

4 

5 

Media 

Rango 

a.m. 7 

8 

9 

15 

4 

11 

9.4 

11 

8 

7 

10 

7 

6 

8 

7.6 

4 

9 

11 

12 

10 

9 

10 

10.4 

3 

10 

12 

8 

6 

9 

12 

9.4 

6 

11 

11 

10 

6 

14 

11 

10.4 

8 

p.m. 12 

7 

7 

10 

4 

11 

7.8 

7 

1 

10 

7 

4 

10 

10 

8.2 

6 

2 

8 

11 

11 

7 

7 

8.8 

4 

3 

8 

11 

8 

14 

12 

10.6 

6 

4 

12 

9 

12 

17 

11 

12.2 

8 

5 

7 

7 

9 

17 

13 

10.6 

10 

6 

9 

9 

4 

4 

11 

7.4 

7 

7 

10 

12 

12 

12 

12 

11.6 

2 

8 

8 

11 

9 

6 

8 

8.4 

5 

9 

10 

13 

9 

4 

9 

9.0 

9 

10 

9 

11 

8 

5 

11 

8.8 

6 

Total 






150.6 

102 


El valor de la media total X en la tabla es 9.413 minutos, determinado mediante 150.6/16. 
La media de los rangos (fí) es 6.375 minutos, que se determinó mediante 102/16. Por lo tanto, 
el límite de control superior es: 

LCS = X + A 2 R = 9.413 + 0.577(6.375) = 13.091 

El límite de control inferior es: 

LCI = X- A 2 R = 9.413 - 0.577(6.375) = 5.735 

X, LCS y LCI y las medias de las muestras se presentan en la gráfica 19-4. La media, X, es 
9.413 minutos, el límite de control superior se ubica en 13.091 minutos, y el límite de control 
inferior, en 5.735 minutos. Hay una variación en la duración de las llamadas, pero todas las 
medias de la muestra están dentro de los límites de control. Por lo tanto, con base en 16 mues- 
tras de 5 llamadas, la conclusión es que 99.74% de las veces, la duración media de una mues- 
tra de 5 llamadas estará entre 5.735 minutos y 13.091 minutos. 



GRAFICA 19-4 Diag rama de control de la duración media de las llamadas de clientes a Statistical 


Software, Inc. 


19.5 Objetivo y tipos de diagramas de control de calidad 
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Estadística en acción 

Con ayuda de los diagra- 
mas de control, se consig- 
nó a una persona que 
sobornaba a jugadores de 
hai-alai para que perdie- 
ran. Las gráficas X y R 
revelaron patrones de 
apuestas inusuales y que 
algunos apostadores no 
ganaron cuando hicieron 
ciertas apuestas. Un 
experto en calidad “bajo 
control” pudo identificar 
las ocasiones en que cesó 
la variación asignable y 
los fiscales las relaciona- 
ron con la detención del 
sospechoso. 


Puesto que la teoría estadística se basa en la normalidad de muestras grandes, los dia- 
gramas de control deben tener como base un proceso estable, es decir, una muestra muy 
grande tomada durante un periodo extenso. Una regla básica es diseñar el diagrama después 
de seleccionar al menos 25 muestras. 


Diagrama de rangos 

Además de la ubicación central en una muestra, también debe supervisar la cantidad de varia- 
ción de muestra en muestra. Un diagrama de rangos presenta la variación de los rangos de 
las muestras. Si los puntos que representan los rangos se encuentran entre los límites supe- 
rior e inferior, concluya que la operación está bajo control. De acuerdo con la casualidad, casi 
997 de 1 000 veces el rango de las muestras estará dentro de los límites. Si el rango cae arri- 
ba de los límites, concluya que una causa asignable afectó la operación y es necesario ajus- 
tar el proceso. ¿Por qué no interesa el límite de control inferior del rango? Con frecuencia, en 
muestras pequeñas el límite inferior es cero. En realidad, en cualquier muestra de seis o 
menos, el límite de control inferior es 0. Si el rango es cero, entonces por lógica todas las par- 
tes son iguales y no hay problema con la variabilidad de la operación. 

Los límites de control superior e inferior del diagrama de rangos se determinan a partir de 
las siguientes ecuaciones. 


r 


DIAGRAMA DE CONTROL DE RANGOS 


LCS = D 4 fí LCI = D S R 


(19-5) 




Los valores de D 3 y D 4 , que reflejan los límites habituales 3a (sigma) de varios tamaños de la 
muestra, aparecen en el apéndice B.8 o en la tabla de la página 731 . 


Cjemplo 


Solución 


El tiempo que los clientes de Statistical Software, Inc., esperaron desde que entró su llamada 
hasta que un representante técnico respondió su pregunta o resolvió su problema se encuen- 
tra registrado en la tabla 19-1. Elabore un diagrama de control de rangos. ¿Parece que hay 
algún momento en el que es demasiada la variación en la operación? 


El primer paso es encontrar la media de los rangos de la muestra. El rango de las cinco llama- 
das de la muestra de las 7 a.m. es 1 1 minutos. La llamada de mayor duración seleccionada en 
esa hora fue de 15 minutos, y la más breve, de 4 minutos; la diferencia es 11 minutos. A las 8 
a.m., el rango es de 4 minutos. El total de los 16_rangos es 102 minutos, por lo que el rango 
promedio es de 6.375 minutos, determinado por R = 102/16. Con referencia al apéndice B.8 
o a la tabla parcial de la página 731, D 3 y D 4 son 0 y 2.115, respectivamente. Los límites de 
control superior e inferior son 0 y 13.483. 

LCS = D 4 fí = 2.115(6.375) = 13.483 
LCI = D 3 R = 0(6.375) = 0 

El diagrama del trazo de los 16 rangos de las muestras aparece en la gráfica 19-5. Este diagra- 
ma indica que todos los rangos están dentro de los límites de control. De aquí, se concluye que 
la variación en el tiempo para atender las llamadas de los clientes está dentro de los límites nor- 
males, es decir, “bajo control”. Por supuesto, debe determinar los límites de control con base 
en un conjunto de datos y luego aplicarlos para evaluar datos futuros, no los datos que ya 
conoce. 
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OA7 Comparar las gráficas 
de calidad bajo control y 
fuera de control. 



Hora 

GRÁFICA 19-5 Diagrama de control de rangos de la duración de las llamadas de los clientes a 
Statistical Software, Inc. 


Minitab presenta un diagrama de control de la media y el rango. La siguiente es la captu- 
ra de pantalla del ejemplo de Statistical Software. Los datos están en la tabla 19-1 . Las peque- 
ñas diferencias entre los límites de control se deben al redondeo. 



19.6 Situaciones bajo control 
y fuera de control 

Tres ilustraciones de procesos bajo control y fuera de control son los siguientes: 

1 . El diagrama de la media y el de rangos en conjunto indican que el proceso está bajo con- 
trol. Observe que la media y los rangos de las muestras se agrupan cerca de las líneas 
centrales. Algunos están arriba y otros debajo de las líneas centrales, lo que Indica que el 
proceso es muy estable; es decir, no hay una tendencia visible para que la media y los ran- 
gos se desplacen hacia las áreas fuera de control. 


Gráfica de la media 



Todo está bien. 


LCI 
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2. La media de las muestras está bajo control, pero los rangos de las últimas dos muestras 
no lo están. Esto indica que hay una variación considerable en las muestras. Algunos ran- 
gos de las muestras son grandes, y otros, pequeños. Es probable que se requiera ajustar 
el proceso. 


Variación considerable en los 
rangos 


Gráfica de la media 



3. La media está bajo control en las primeras muestras, pero hay una tendencia ascenden- 
te hacia el LCS. Las dos últimas medias de las muestras están fuera de control. 
Probablemente sea necesario ajustar el proceso. 


Media fuera de control 




LCI 
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La gráfica anterior de la media es un ejemplo de una gráfica de control que ofrece cierta 
información adicional. JDbserve la dirección de las últimas cinco observaciones de la media. 
Todas están arriba de X, y, de hecho, las últimas dos observaciones están fuera de control. Es 
poco probable que las medias de la muestra aumentaran durante seis observaciones conse- 
cutivas, lo cual es otra indicación de que el proceso está fuera de control. 



La gerente de River City McDonald’s selecciona al azar cuatro clientes por hora. Luego, mide el 
tiempo, en minutos, entre la entrada de la orden que ellos solicitan y su entrega. Los resultados son 
los siguientes. 


Hora 

Tiempos de la muestra 

1 

2 

3 

4 

9 a.m. 

1 

4 

5 

2 

10 a.m. 

2 

3 

2 

1 

11 a.m. 

1 

7 

3 

5 


a) Calcule el tiempo medio de espera, el rango medio y determine los límites de control de la media 
y el rango, y trace con ellos un diagrama. 

b) ¿Las mediciones están dentro de los límites de control? Interprete la gráfica. 


comed: 


Ejercicios 

3. Describa la diferencia entre variación asignable y variación aleatoria. 

4. Describa la diferencia entre una gráfica de control de atributos y una gráfica de control de varia- 
bles. 

5. De una línea de producción se toman muestras de tamaño n = 4. 

a) ¿Cuál es el valor del factor A 2 para determinar los límites de control superior e inferior de la 
media? 

b) ¿Cuáles son los valores de los factores D 3 y D 4 para determinar los límites de control superior 
e inferior de la media? 

6. De un proceso de manufactura se seleccionan muestras de 5. La media de los rangos de la mues- 
tra es 0.50. Estime la desviación estándar de la población. 

7. En Piatt Bakery se acaba de instalar un nuevo horno industrial. Para conocer la temperatura del 
horno, un inspector lee la temperatura en cuatro lugares distintos dentro del horno cada media 
hora. La primera lectura, a las 8:00 a.m., fue de 340 grados Fahrenheit. (Para facilitar los cálculos 
en la siguiente tabla sólo se dan los primeros dos dígitos.) 


Hora 


Lectura 


1 

2 

3 

4 

8:00 a.m. 

40 

50 

55 

39 

8:30 a.m. 

44 

42 

38 

38 

9:00 a.m. 

41 

45 

47 

43 

9:30 a.m. 

39 

39 

41 

41 

10:00 a.m. 

37 

42 

46 

41 

10:30 a.m. 

39 

40 

39 

40 


a) Con base en esta experiencia inicial, determine los límites de control de la temperatura media. 
Determine la media total. Trace la experiencia en una gráfica. 

b) Interprete la gráfica. ¿Parece haber una hora en que la temperatura está fuera de control? 

8. Consulte el ejercicio 7. 

a) Con base en esta experiencia inicial, determine los límites de control del rango. Trace la expe- 
riencia en una gráfica. 

b) ¿Parece haber una hora en la que hay demasiada variación de temperatura? 
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19.7 Diagramas de control de atributos 

OA8 Construir e interpretar Con frecuencia, los datos que se recopilan son el resultado de contar en vez de medir. Es decir, 
un porcentaje defectuoso y se observa la presencia o ausencia de algún atributo. Por ejemplo, la tapa roscada de un fras- 

una gráfica de barras c. co de champú se ajusta sin dejar salir líquido (una condición “aceptable”) o bien no sella y deja 

salir líquido (una condición “inaceptable”), o un banco otorga un préstamo a un cliente, quien 
le paga o no le paga. En otros casos, interesa el número de defectos de una muestra. La British 
Airways puede contar el número de sus vuelos demorados por día en Gatwick Airport, en 
Londres. En esta sección se estudian dos tipos de diagramas de atributos: la tabla p (porcen- 
taje defectuoso) y la gráfica de barras c (número de defectos). 


Diagrama de porcentaje defectuoso 

Si el artículo registrado es la fracción de partes inaceptables existentes en un lote grande, el 
diagrama de control apropiado es el diagrama de porcentaje defectuoso, cuya base es 
la distribución binomial, que se analizó en el capítulo 6, y las proporciones, en e[ capítulo 9. La 
línea central está en p, la proporción media de defectos. La p reemplaza a la X del diagrama 
de control de variables. La proporción media de defectos se obtiene mediante: 


( 

PROPORCIÓN MEDIA DE DEFECTOS 

V 


_ Número total de defectos 

^ Número total de artículos de la muestra 


\ 

(19-6) 

J 


La variación en la proporción de la muestra se describe por medio del error estándar de una 
proporción. Se determina por medio de: 


ERROR ESTÁNDAR DE LA PROPORCIÓN DE LA MUESTRA 


P( 1 - P) 


(19-7) 

V 


Por lo tanto, el límite de control superior (LCS) y el límite de control inferior ( LCI ) se calcu- 
lan como el porcentaje medio más o menos tres veces el error estándar de los porcentajes 
(proporciones). La fórmula de los límites de control es: 


/ ~~ ' — ~ 

LÍMITES DE CONTROL DE PROPORCIONES 

V 


LCI, LCS = p ± 3 


P( 1 - P) 


\ 

(19-8) 

) 


Un ejemplo ilustrará los detalles de los cálculos y las conclusiones. 


Cjemplo 

Jersey Glass Company, Inc., produce espejos pequeños de mano. La compañía opera un turno 
diurno y uno vespertino cada día laboral de la semana. El departamento de aseguramiento de 


calidad (QA) supervisa la calidad de los espejos dos veces durante el turno diurno y dos veces 
durante el vespertino. El departamento de calidad selecciona e inspecciona minuciosamente 
una muestra aleatoria de 50 espejos cada 4 horas. Cada espejo se clasifica como aceptable o 
inaceptable. Por último, se cuenta el número de espejos incluidos en la muestra que no cum- 
plen con las especificaciones de calidad. Los siguientes son los resultados de estas verifica- 
ciones durante los últimos 10 días laborables. 
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Solución 


Fecha 

Número 

muestreado 

Defectos 

Fecha 

Número 

muestreado 

Defectos 

1 0-0ct 

50 

1 

17-0ct 

50 

7 


50 

0 


50 

9 


50 

9 


50 

0 


50 

9 


50 

8 

11-0ct 

50 

4 

18-0ct 

50 

6 


50 

4 


50 

9 


50 

5 


50 

6 


50 

3 


50 

1 

12-0ct 

50 

9 

19-0ct 

50 

4 


50 

3 


50 

5 


50 

10 


50 

2 


50 

2 


50 

5 

13-0ct 

50 

2 

20-0ct 

50 

0 


50 

4 


50 

0 


50 

9 


50 

4 


50 

4 


50 

7 

14-0ct 

50 

6 

21-0ct 

50 

5 


50 

9 


50 

1 


50 

2 


50 

9 


50 

4 


50 

9 


Elabore el diagrama del porcentaje defectuoso de este proceso. ¿Cuáles son los límites de 
control superior e inferior? Interprete los resultados. ¿Parece que el proceso está fuera de con- 
trol durante el periodo? 

El primer paso es determinar la proporción media de defectos. Utilice la fórmula (19-6). 

Número total de defectos 196 

p = = = .098 

Número total de artículos muestreados 2 000 

Por lo tanto, se estima que 0.098 de los espejos producidos durante el periodo no cumplen las 
especificaciones. 


Fecha 

Número 

muestreado 

Defectos 

Fracción 

defectuosa 

Fecha 

Número 

muestreado 

Defectos 

Fracción 

defectuosa 

1 0-0ct 

50 

1 

0.02 

17-0ct 

50 

7 

0.14 


50 

0 

0.00 


50 

9 

0.18 


50 

9 

0.18 


50 

0 

0.00 


50 

9 

0.18 


50 

8 

0.16 

11-0ct 

50 

4 

0.08 

18-0ct 

50 

6 

0.12 


50 

4 

0.08 


50 

9 

0.18 


50 

5 

0.10 


50 

6 

0.12 


50 

3 

0.06 


50 

1 

0.02 

12-0ct 

50 

9 

0.18 

19-0ct 

50 

4 

0.08 


50 

3 

0.06 


50 

5 

0.10 


50 

10 

0.20 


50 

2 

0.04 


50 

2 

0.04 


50 

5 

0.10 

13-0ct 

50 

2 

0.04 

20-0ct 

50 

0 

0.00 


50 

4 

0.08 


50 

0 

0.00 


50 

9 

0.18 


50 

4 

0.08 


50 

4 

0.08 


50 

7 

0.14 

14-0ct 

50 

6 

0.12 

21-0ct 

50 

5 

0.10 


50 

9 

0.18 


50 

1 

0.02 


50 

2 

0.04 


50 

9 

0.18 


50 

4 

0.08 


50 

9 

0.18 





Total 

2 000 

196 
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Los límites de control superior e inferior se calculan con la fórmula (19-8) 


LCI, LCS = p± 3 


P( 1 - P) 


.098 ± 3 



= .098 ± .1261 


A partir de los cálculos anteriores, el límite de control superior es 0.2241, determinado por 
0.098 + 0.1261. El límite de control inferior es 0. ¿Por qué? El límite inferior calculado con la 
fórmula es 0.098 - 0.1261 = -0.0281 . Sin embargo, no es posible una proporción negativa de 
defectos, por lo que el valor menor es 0. Entonces, los límites de control son 0 y 0.2241. 
Cualquier muestra fuera de estos límites indica que cambió el nivel de calidad del proceso. 

Esta información se resume en la gráfica 19-6, que es la captura de pantalla del software 
Minitab. 



GRÁFICA 19-6 


Diagrama del porcentaje defectuoso de la proporción de espejos defectuosos 
de Jersey Glass 


Después de establecer los límites, el proceso se supervisa durante la siguiente semana, 
cinco días, dos turnos por día, con dos verificaciones de calidad por turno. Los resultados son 
los siguientes. 


Fecha 

Número 

muestreado 

Defectos 

Fracción 

defectuosa 

Fecha 

Número 

muestreado 

Defectos 

Fracción 

defectuosa 

24-0ct 

50 

1 

0.02 

27-0ct 

50 

2 

0.04 


50 

13 

0.26 


50 

1 

0.02 


50 

10 

0.20 


50 

7 

0.14 


50 

7 

0.14 


50 

12 

0.24 

25-0ct 

50 

4 

0.08 

28-0ct 

50 

5 

0.10 


50 

5 

0.10 


50 

5 

0.10 


50 

6 

0.12 


50 

10 

0.20 


50 

10 

0.20 


50 

9 

0.18 

26-0ct 

50 

6 

0.12 






50 

1 

0.02 






50 

8 

0.16 






50 

4 

0.08 






El proceso estuvo fuera de control en dos ocasiones, el 24 de octubre, cuando el número 
de defectos fue 13, y el 27 de octubre, cuando el número de defectos fue 12. El departamen- 
to de calidad debe reportar esta información al de producción para tomar las medidas perti- 
nentes. La siguiente es la captura de pantalla de Minitab. 
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Diagrama de líneas c 

La gráfica de líneas c traza el número de defectos o fallas por unidad. Se basa en la distribu- 
ción de Polsson, que estudió en el capítulo 6. El número de maletas maltratadas en un vuelo 
por Southwest Airlines se puede supervisar mediante una gráfica de barras c. La “unidad” en 
consideración es el vuelo. En la mayoría de los vuelos no hay maletas maltratadas. En otros 
puede haber una, y en algunos más, dos, etc. El Infernal Revenue Service puede contar y ela- 
borar un diagrama de control del número de errores aritméticos en las declaraciones de 
impuestos. La mayoría de las declaraciones de Impuestos no tendrán ningún error, algunas 
tendrán un solo error, otras tendrán dos, etc. Designe c como el número medio de defectos 
por unidad. Por lo tanto, c es el número medio de maletas maltratadas por Southwest Airli- 
nes por vuelo o el número medio de errores aritméticos por declaración de impuestos. 
Recuerde, del capítulo 6, que la desviación estándar de una distribución de Poisson es la raíz 
cuadrada de la media. Por lo tanto, es posible determinar los límites de 3 sigma o 99.74% en 
un diagrama de barras c mediante: 


LÍMITES DE CONTROL DEL NÚMERO 
DE DEFECTOS POR UNIDAD 


LCI , LCS = c ± 3Vc 


( 19 - 9 ) 


y 



El editor del Oak Harbor Daily Telegraph está preocupado por el número de palabras mal escri- 
tas en el periódico. No publican en sábado y domingo. En un esfuerzo por controlar el proble- 
ma y fomentar la buena ortografía, utilizó un diagrama de control. El número de palabras mal 
escritas que determinó en la edición final del periódico de los últimos 10 días es: 5, 6, 3, 0, 4, 
5, 1 , 2, 7 y 4. Determine los límites de control apropiados e interprete el diagrama. ¿Hubo algu- 
nos días durante el periodo en que el número de palabras mal escritas estuvo fuera de control? 

Durante el periodo de 10 días hubo un total de 37 palabras mal escritas. El número medio de 
palabras mal escritas por edición es 3.7, y sigue la distribución de probabilidad de Poisson. La 
desviación estándar es la raíz cuadrada de la media. 


c = 


2X 5 + 6 


n 


10 


--To-” 


s = Ve = V3/7 = 1 .924 


Para encontrar el límite de control superior utilice la fórmula (19-9). El límite de control inferior 
es cero. 

LCI = c + 3Vó = 3.7 + 3 V377 = 3.7 + 5.77 = 9.47 
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El límite de control inferior calculado sería 3.7 - 3(1.924) = -2.07. Sin embargo, el número de 
palabras mal escritas no puede ser menor que 0, por lo que debe emplear 0 como límite infe- 
rior. El límite de control inferior es 0, y el superior, 9.47. Cuando se compara cada uno de los 
puntos de datos con el valor 9.47, resulta que todos son menores que el límite de control supe- 
rior; el número de palabras mal escritas “está bajo control”. Por supuesto, el periódico hará un 
esfuerzo para eliminar todas las palabras mal escritas, pero las técnicas de los diagramas de 
control ofrecen un medio para dar seguimiento a los resultados diarios y determinar si hay un 
cambio. Por ejemplo, si se contrata una nueva correctora de pruebas, se puede comparar su 
trabajo con el de otros. Estos resultados se resumen en la gráfica 19-7, que es la captura de 
pantalla de Minitab. 



GRAFICA 19-7 Diag rama de control c de las palabras mal escritas por edición del Oak Harbor 
Daily Telegraph 



Auto-Lite Company fabrica baterías para automóviles. Al final de cada turno, el departamento de 
calidad selecciona una muestra de baterías para probarlas. El número de unidades defectuosas 
durante los últimos 12 turnos es 2, 1 , 0, 2, 1 , 1 , 7, 1 , 1 , 2, 6 y 1 . Elabore un diagrama de control del 
proceso y comente si está bajo control. 


comed 


Ejercicios 

9. El siguiente es un diagrama del porcentaje de defectos de un proceso de manufactura. 


Diagrama de defectos P 
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Estadística en acción 

A finales de la década de 
1980 se informó que una 
empresa canadiense orde- 
nó algunas partes a una 
compañía japonesa con 
instrucciones de que no 
debería haber “más de 
tres partes defectuosas 
por millar”. Cuando las 
partes llegaron, había 
una nota que decía: “Sus 
tres partes defectuosas 
están envueltas por sepa- 
rado en el compartimen- 
to superior izquierdo del 
embarque”. Ha pasado 
mucho tiempo desde los 
días cuando “Hecho en 
Japón” significaba barato, 
mas no confiable. 



a) ¿Cuál es la media del porcentaje de defectos? ¿Cuáles son los límites de control superior e 
inferior? 

b) ¿Hay algunas observaciones en la muestra que indiquen que el proceso está fuera de control? 
¿Cuáles números de muestra son? 

c) ¿Parece que hay alguna tendencia en el proceso? Es decir, ¿parece que el proceso mejora, 
empeora o permanece igual? 

10. Inter State Moving and Storage Company establece un diagrama de control para supervisar la pro- 
porción de mudanzas residenciales que generan quejas por escrito por tardanzas, o artículos per- 
didos o dañados. Se selecciona una muestra de 50 mudanzas de cada uno de los últimos 12 
meses. El número de quejas en cada muestra es 8, 7, 4, 8, 2, 7, 11, 6, 7, 6, 8 y 12. 

a) Diseñe un diagrama de porcentaje de defectos. Intercale la media del porcentaje de defectos 
en el rango LCS y LCI. 

b) Grafique la proporción de quejas por escrito en los últimos 12 meses. 

c) Interprete el diagrama. ¿Parece que el número de quejas está fuera de control en algún mes? 

11. Un fabricante de bicicletas selecciona al azar 1 0 cuadros cada día y los prueba para detectar algún 
defecto. El número de cuadros defectuosos que se determinó durante los últimos 14 días es 3, 2, 
1 , 3, 2, 2, 8, 2, 0, 3, 5, 2, 0 y 4. Elabore el diagrama de control de este proceso y comente si está 
“bajo control”. 

12 . Scott Paper, con el fin de probar su papel higiénico, somete 15 rollos a una prueba de resistencia 
en húmedo para ver si se rasga, y con qué frecuencia. Los siguientes son los números de defec- 
tos que se encontraron durante los últimos 15 días: 2, 3, 1 , 2, 2, 1 , 3, 2, 2, 1 , 2, 2, 1 , 0 y 0. Elabore 
el diagrama de control del proceso y comente si está “bajo control”. 

13 . Sam’s Supermarkets prueba sus cajeros al examinar al azar los recibos impresos para detectar 
errores de exploración de precios. Los siguientes números corresponden a cada recibo del 27 de 
octubre: 0, 1 , 1 , 0, 0, 1 , 1 , 0, 1 , 1 , 0. Elabore el diagrama de control del proceso y comente si está 
“bajo control”. 

14 . Dave Christi dirige una cadena de autolavado con sucursales en todo Chicago y le preocupa que 
algunos gerentes locales lavan gratis los automóviles de sus amigos, por lo que decide recopilar 
datos sobre el número de recibos de venta “anulados”. Por supuesto, algunos son legítimos. 3, 8, 
3, 4, 6, 5, 0, 1, 2, 4, ¿indicarían un número razonable de anulaciones en sus instalaciones? Elabore 
un diagrama de control del proceso y comente si está “bajo control”. 


19.8 Muestreo de aceptación 

La sección anterior trató acerca de mantener la 
calidad del producto a medida que se fabrica. En 
muchas situaciones de negocios también interesa 
la calidad del producto terminado que se recibe. 
¿Qué tienen en común los siguientes casos? 

• Sims Software, Inc., es cliente de DVD Inter- 
national. La orden de compra normal es de 
100 000 DVD, empacados en lotes de 1 000. 
Todd Sims, el presidente, no espera que todos 
los DVD sean perfectos. En realidad, ha acep- 
tado lotes de 1 000 hasta con 10% de defectos, y quiere desarrollar un plan para inspec- 
cionar los lotes que le llegan, para estar seguro de que se cumple con el estándar de cali- 
dad. El propósito del procedimiento de inspección es separar los lotes aceptables de los 
inaceptables. 

• Zenith Electric compara tubos magnetrón de Bono Electronics para su nuevo horno de 
microondas. Los magnetrones se embarcan a Zenith en lotes de 10 000 unidades. Zenith 
permite que los lotes que recibe contengan hasta 5% de magnetrones defectuosos. Le 
gustaría elaborar un plan de muestreo para determinar los lotes que cumplen con el crite- 
rio y los que no lo hacen. 
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General Motors compra parabrisas de muchos proveedores. GM insiste en que los lotes 
sean de 1 000, y está dispuesto a aceptar 50 o menos defectos en cada lote, es decir, 5% 
de defectos. Le gustaría desarrollar un procedimiento de muestreo para verificar que los 
embarques que recibe cumplan con el criterio. 


OA9 Analizar el muestreo 
de aceptación. 


Muestreo de aceptación 
Número de aceptación 


Riesgo del consumidor 
Riesgo del productor 


El hilo conductor en estos casos es la necesidad de verificar que un producto que entra 
a la planta cumpla con los requisitos estipulados. La situación es semejante a una puerta de 
mosquitero, que permite que entre el aire caliente del verano al recinto mientras mantiene 
afuera a los mosquitos. El muestreo de aceptación permite que entren los lotes con calidad 
aceptable al área de manufactura y se queden afuera los que no son aceptables. 

Por supuesto, la situación en los negocios modernos es más compleja. El comprador 
quiere protección para no aceptar lotes inferiores al estándar de calidad. La mejor protección 
contra la calidad inferior es una inspección de 100%. Desafortunadamente, con frecuencia el 
costo de una inspección de 100% es prohibitivo. Otro problema con la verificación de cada 
artículo es que la prueba puede ser destructiva. Si se probaran todos los focos hasta que se 
fundieran antes de su embarque, no quedaría ninguno para vender. Asimismo, la inspección 
de 100% quizá permita identificar todos los defectos. Por lo tanto, en situaciones prácticas, 
pocas veces se lleva a cabo una inspección completa. 

El procedimiento habitual es examinar la calidad de las partes de entrada mediante un 
plan de muestreo estadístico. De acuerdo con este plan, se selecciona al azar una muestra de 
n unidades de los lotes de N unidades (la población). Esto se denomina muestreo de acep- 
tación. La inspección determinará el número de defectos que hay en la muestra. Este núme- 
ro se compara con uno predeterminado, denominado número crítico o número de acepta- 
ción. Por lo general, el número de aceptación se designa c. Si el número de defectos en la 
muestra de tamaño n es menor o igual a c, el lote se acepta. Si el número de defectos exce- 
de c, el lote se rechaza y se regresa al proveedor, o tal vez se someta a una inspección com- 
pleta. 

El muestreo de aceptación es un proceso de toma de decisiones. Hay dos decisiones 
posibles: aceptar o rechazar el lote. Además, hay dos situaciones en las cuales se toma la 
decisión: el lote es bueno o el lote es malo. Éstos son estados de la naturaleza. Si el lote es 
bueno y la Inspección de la muestra revela que el lote es bueno, o si el lote es malo y la ins- 
pección de la muestra Indica que es malo, se toma una decisión correcta. Sin embargo, hay 
otras dos posibilidades. El lote puede contener más defectos que los aceptables, pero se 
acepta. A esto se denomina riesgo del consumidor. De manera similar, el lote puede estar 
dentro de los límites acordados, pero se rechaza durante la inspección de la muestra. A esto 
se le denomina riesgo del productor. La siguiente tabla resume las decisiones de aceptación 
presentes en estas posibilidades. Observe cómo esta decisión es muy similar a las ¡deas de 
los errores de Tipo I y Tipo II del inicio del capítulo 10, a partir de la página 359, en la sección 
10 - 10 . 


OA1 0 Describir una curva 
característica de operación de 
varios planes de muestreo. 



Estados de la naturaleza 

Decisión 

Lote bueno 

Lote malo 

Aceptar el lote 

Correcto 

Riesgo del consumidor 

Rechazar el lote 

Riesgo del productor 

Correcto 


Para evaluar un plan de muestreo y determinar que es justo tanto para el productor como 
para el consumidor, el procedimiento usual es desarrollar una curva característica de opera- 
ción, o curva CO, como normalmente se denomina. Una curva CO reporta el porcentaje 
defectuoso en el eje horizontal, y la probabilidad de aceptar ese porcentaje defectuoso, en el 
vertical. Por lo general, se traza una curva uniforme que conecta todos los niveles de calidad 
posibles. Se utiliza la distribución binomial para desarrollar las probabilidades de una curva 
CO. 
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Muestreo de atributos. 


Regla de decisión. 


Como se mencionó antes, Sims Software compra DVD a DVD International. Los artículos se 
empacan en lotes de 1 000 cada uno. Todd Sims, presidente de la empresa, está de acuerdo 
en aceptar lotes con 10% o menos de DVD defectuosos. Todd indicó a su departamento de 
inspección que seleccione una muestra aleatoria de 20 DVD y los examine con detenimiento. 
Aceptará el lote si tiene dos o menos defectos en la muestra. Desarrolle la curva CO de este 
plan de aceptación. ¿Cuál es la probabilidad de aceptar un lote con 10% de DVD defectuo- 
sos? 

Este tipo de muestreo se denomina muestreo de atributos, pues el artículo muestreado, en 
este caso un DVD, se clasifica como aceptable o inaceptable. No se obtiene una “lectura” o 
“medición” del DVD. Sea ir la proporción actual defectuosa en la población. 

El lote es bueno si tt < 0.10. 

El lote es malo si tt > 0.10. 

Sea X el número de defectos en la muestra. La regla de decisión es: 

Aceptar el lote si X < 2. 

Rechazar el lote si X > 3. 

Aquí el lote aceptable es uno con 10% o menos de DVD defectuosos. Si el lote es aceptable 
cuando tiene exactamente 10% de DVD defectuosos, sería aún más aceptable si contuviera 
menos de 10%. Por lo tanto, la práctica usual es trabajar con el límite superior del porcentaje 
de defectos. 

Mediante la distribución binomial se calculan los diversos valores en la CO. Recuerde que 
para emplear la distribución binomial hay cuatro requisitos: 

1 . Sólo hay dos resultados posibles: el DVD es aceptable o inaceptable. 

2. Hay un número fijo de ensayos. En este caso, el número de ensayos es el tamaño de la 
muestra de 20. 

3. Existe una probabilidad constante de éxito. Un éxito es encontrar un DVD defectuoso. La 
probabilidad de éxito se supone de 0.10. 

4. Los ensayos son independientes. La probabilidad de obtener un DVD defectuoso en el ter- 
cero seleccionado no está relacionada con la posibilidad de encontrar un defecto en el 
cuarto. 

En el apéndice B.9 se dan varias probabilidades binomiales. Sin embargo, estas tablas 
sólo llegan a 15, es decir, n = 15. En este problema n = 20; por lo tanto, utilice Excel para 
calcular las varias probabilidades binomiales. La siguiente captura de pantalla de Excel mues- 
tra las probabilidades binomiales para n = 20 cuando u-es igual a 0.05, 0.10, 0.15, 0.20, 0.25 
y 0.30. 

Hay que traducir los términos del capítulo 6 al vocabulario de muestreo de aceptación: ir 
representa la probabilidad de encontrar un defecto, c el número de defectos permitidos, y n el 
número de artículos muestreados. En este caso, permitirá hasta dos defectos, por lo que c = 
2. Esto significa que 0, 1 o 2 de los 20 artículos muestreados pueden ser defectuosos y aun 
así se aceptaría el embarque de entrada de DVD. 

Para empezar, determine la probabilidad de aceptar un lote que sea 5% defectuoso. Esto 
significa que ir = 0.05, c = 2 y n = 20. De la captura de pantalla de Excel, la posibilidad de 
seleccionar una muestra de 20 artículos de un embarque con 5% de defectos y encontrar 
exactamente 0 defectos es 0.358. La posibilidad de encontrar exactamente 1 defecto es 0.377, 
y la de encontrar 2 es 0.189. De aquí que la posibilidad de 2 o menos defectos sea 0.924, que 
se determina mediante 0.358 + 0.377 + 0.189. Este resultado por lo general se escribe en 
notación abreviada, como sigue (recuerde que la barra “|” significa “dado que”). 

P(x < 2|n = .05 y n = 20) = .358 + .377 + .189 = .924 
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y lot fraction detective 

a s c o t t o h i 



La posibilidad de aceptar un lote que en realidad tiene 10% de defectos es 0.677. Es decir, 


P(x < 2 |tt = .10 y n = 20) = .122 + .270 + .285 = .677 

La curva CO completa en la gráfica 19-8 muestra la curva uniformizada para todos los valores 
de 77 entre 0 y casi 30%. No hay necesidad de mostrar los valores mayores que 30% debido a 
que su probabilidad es muy cercana a 0. La posibilidad de aceptar lotes con niveles de calidad 
seleccionados aparece en forma de tabla a la derecha de la gráfica 19-8. Con la curva CO, la 
gerencia de Sims Software podrá evaluar con rapidez las probabilidades de varios niveles de 
calidad. 



Porcentaje defectuoso del lote de entrada 


Porcentaje 
defectuoso 
del lote 
0 
5 
10 
20 
30 


Probabilidad 
de aceptar 
el lote 
1.000 
.924 
.677 
.207 
.036 


GRÁFICA 19-8 Curva CO del plan de muestreo (n = 20, c = 2) 



Calcule la probabilidad de aceptar un lote de DVD con 30% de artículos defectuosos, con el plan 
de muestreo de Sims Software. 
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comed: 


Ejercicios 

15. Determine la probabilidad de aceptar lotes con 10, 20, 30 y 40% de DVD defectuosos, una mues- 
tra de tamaño 12 y un número de aceptación de 2. 

16. Determine la probabilidad de aceptar lotes con 10, 20, 30 y 40% de DVD defectuosos, una 
muestra de tamaño 14 y un número de aceptación de 3. 

17. Warren Electric fabrica fusibles para muchos clientes. Para asegurar la calidad del producto de 
salida, prueba 10 fusibles cada hora. Si no más de un fusible es defectuoso, empaca los fusibles 
y los prepara para su embarque. Desarrolle la curva CO de este plan de muestreo. Calcule las pro- 
babilidades de aceptar lotes con 10, 20, 30 y 40% de unidades defectuosas. Trace la curva CO de 
este plan de muestreo con los cuatro niveles de calidad. 

18. Grills Radio Products compra transistores de Mira Electronics. De acuerdo con su plan de mues- 
treo, el propietario, Art Grills, aceptará un embarque de transistores si tres o menos son defectuo- 
sos en una muestra de 25. Elabore la curva CO de estos porcentajes de defectos: 10, 20, 30 y 
40%. Necesitará un paquete de software estadístico. 


Resumen del capítulo 

I. El objetivo del control estadístico de calidad es seguir de cerca la calidad del producto o servicio a 
medida que se elabora. 

II. El diagrama de Pareto es una técnica para contar el número y tipo de defectos que se presentan 
en un producto o servicio. 

A. Esta gráfica recibe su nombre en honor de un científico italiano, Vilfredo Pareto. 

B. El concepto del diagrama es que 20% de los factores ocasiona 80% de la actividad. 

III. Un diagrama de esqueleto de pez destaca la relación entre una posible causa de un problema que 
producirá el efecto particular. 

A. También se denomina diagrama de causa y efecto. 

B. El enfoque habitual es considerar cuatro áreas del problema: métodos, materiales, equipamien- 
to y personal. 

IV. El propósito de un diagrama de control es supervisar la calidad de un producto o servicio. 

A. Hay dos tipos de diagramas de control. 

1. Un diagrama de control de variables es el resultado de una medición. 

2. Un diagrama de atributos indica si el producto o servicio es aceptable o no. 

B. Existen dos fuentes de variación de la calidad de un producto o servicio. 

1. Variación casual, de naturaleza aleatoria y no se puede controlar o eliminar. 

2. Variación asignable, que no es por causas aleatorias y se puede eliminar. 

C. En este capítulo se consideraron cuatro gráficas de control. 

1. Una gráfica de la media indica la media de una variable, y una gráfica de rangos presenta el 
rango de la variable. 

a) Los límites de control superior e inferior se determinan en más o menos 3 desviaciones 
estándar de la media. 

b) Las fórmulas de los límites de control superior e inferior de la media son: 

LCS = X + A 2 R LCI = X - A 2 R (19-4) 

c) Las fórmulas de los límites de control superior e inferior del rango son: 

LCS = D 4 fí LCI = D 3 R (19-5) 

2. Un diagrama del porcentaje defectuoso es un diagrama de atributos que presenta la pro- 
porción del producto o servicio que no cumple con el estándar. 

a) El porcentaje defectuoso medio se determina mediante 

Número total de defectos 

n = (19-6) 

Numero total de artículos muestreados 

b) Los límites de control de la proporción defectuosa se determinan a partir de la ecuación 


P( 1 -P) 


LCI, LCS = p± 3 


(19-8) 


Ejercicios del capítulo 
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3. Una gráfica de líneas c se refiere al número de defectos por unidad. 

a) Se basa en la distribución de Poisson. 

b) El número medio de defectos por unidad es c. 

c) Los límites de control se determinan a partir de la siguiente ecuación. 

LCI, LCS = c± 3 Ve ( 19 - 9 ) 

V. El muestreo de aceptación es un método para determinar si el lote de entrada de un producto cum- 
ple con los estándares especificados. 

A. Se basa en técnicas de muestreo aleatorio. 

B. Se selecciona una muestra de n unidades de una población de N unidades. 

C. c es el número máximo de unidades defectuosas que se pueden encontrar en la muestra de n 
unidades y aún considerar aceptable el lote. 

D. Una curva CO (característica de operación) se elabora con la distribución de probabilidad bino- 
mial para determinar la probabilidad de aceptar lotes con varios niveles de calidad. 


Clave 

de pronunciación 


SÍMBOLO 

SIGNIFICADO 

PRONUNCIACIÓN 

X 

Media de las medias muéstrales 

X doble barra 

Sx 

Error estándar de la media 

s subíndice X 

a 2 

Constante de determinar los límites de control 
superior e inferior de la media 

A subíndice 2 

R 

Media de los rangos de las muestras 

R barra 

d 4 

Constante para determinar el límite 
de control superior del rango 

D subíndice 4 

c 

Número medio de defectos por unidad 

c barra 


Ejercicios del capítulo 

19 . El supervisor de producción de Westburg Electric, Inc., observó un incremento del número de 
motores eléctricos rechazados en el momento de la inspección final. De los últimos 200 motores 
rechazados, 80 defectos se debieron a un cableado deficiente, 60 tenían un cortocircuito en la 
bobina, 50 bujías defectuosas y 10 padecían otras fallas. Desarrolle un diagrama de Pareto que 
muestre las principales áreas problemáticas. 

20 . Un fabricante de zapatos deportivos realizó un estudio acerca de sus nuevos zapatos para trotar. 
Los siguientes son el tipo y frecuencia de las discrepancias y fallas que se encontraron. Desarrolle 
el diagrama de Pareto que indique las principales áreas problemáticas. 


Tipo de discrepancia 

Frecuencia 

Tipo de discrepancia 

Frecuencia 

Separación de la suela 

34 

Ruptura de agujetas 

14 

Separación del tacón 

98 

Defecto en ojal 

10 

Abertura en la suela 

62 

Otro 

16 


21 . En Rumsey’s Oíd Fashion las bebidas gaseosas se sirven con una máquina automática cuya ope- 
ración se basa en el peso de la bebida. Cuando el proceso está bajo control, la máquina llena cada 
vaso de modo que la media total es de 10.0 onzas y el rango medio de 0.25 en el caso de mues- 
tras de 5. 

a) Determine los límites de control superior e inferior del proceso tanto de la media como del 
rango. 

b) El gerente de la tienda 1-280 probó cinco bebidas gaseosas servidas la hora pasada y encon- 
tró que la media fue de 10.16 onzas y ei rango de 0.35 onzas. ¿Está bajo control el proceso? 
¿Debe tomarse otra acción? 

22 . Recientemente se instaló una máquina nueva para cortar y desbastar piezas grandes. Luego las 
piezas se transfieren a una pulidora de precisión. Una de las medidas críticas es el diámetro exte- 
rior. El inspector de calidad selecciona al azar cinco piezas cada media hora, mide el diámetro 
exterior y registra los resultados. Las mediciones (en milímetros) del periodo de las 8:00 a.m. a las 
10:30 a.m. son los siguientes. 
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Hora 


Diámetro exterior (milímetros) 


1 

2 

3 

4 

5 

8:00 

87.1 

87.3 

87.9 

87.0 

87.0 

8:30 

86.9 

88.5 

87.6 

87.5 

87.4 

9:00 

87.5 

88.4 

86.9 

87.6 

88.2 

9:30 

86.0 

88.0 

87.2 

87.6 

87.1 

10:00 

87.1 

87.1 

87.1 

87.1 

87.1 

10:30 

88.0 

86.2 

87.4 

87.3 

87.8 


a) Determine los límites de control de la media y del rango. 

b) Trace los límites de control del diámetro exterior medio y del rango. 

c) ¿Hay algunos puntos en la gráfica de la media o del rango fuera de control? Comente sobre la 
gráfica. 

23 . Long Last Company, como parte de su proceso de inspección, prueba sus neumáticos para veri- 
ficar el desgaste del área de contacto en condiciones de caminos simulados. Se seleccionaron 20 
muestras de 3 neumáticos de turnos distintos durante el mes pasado. El desgaste del área de con- 
tacto aparece a continuación, en centésimos de pulgada. Sffí 


Desgaste del área 
Muestra de contacto 


1 

44 

41 

19 

2 

39 

31 

21 

3 

38 

16 

25 

4 

20 

33 

26 

5 

34 

33 

36 

6 

28 

23 

39 

7 

40 

15 

34 

8 

36 

36 

34 

9 

32 

29 

30 

10 

29 

38 

34 


Desgaste del área 
Muestra de contacto 


11 

11 

33 

34 

12 

51 

34 

39 

13 

30 

16 

30 

14 

22 

21 

35 

15 

11 

28 

38 

16 

49 

25 

36 

17 

20 

31 

33 

18 

26 

18 

36 

19 

26 

47 

26 

20 

34 

29 

32 


a) Determine los límites de control de la media y del rango. 

b) Trace los límites de control del desgaste del área de contacto medio y del rango. 

c) ¿Hay algunos puntos en la gráfica de la media o del rango “fuera de control”? Comente sobre 
la gráfica. 

24 . Charter National Bank tiene un grupo de ejecutivos de préstamos en sus sucursales de todo el 
suroeste de Estados Unidos. Robert Kerns, vicepresidente de préstamos, quiere obtener informa- 
ción sobre la cantidad común de los préstamos y el rango de la cantidad de los préstamos. Su 
analista de personal seleccionó una muestra de 10 ejecutivos de préstamos así como una mues- 
tra de cinco préstamos que cada uno de ellos otorgó el mes pasado. Los datos aparecen en la 
siguiente tabla. Elabore una gráfica de control de la media y del rango. ¿Parece que alguno de los 
ejecutivos está “fuera de control”? Comente sus resultados. > 


Cantidad del préstamo 
(miles de dólares) 


Ejecutivo 

1 

2 

3 

4 

5 

Weinraub 

59 

74 

53 

48 

65 

Visser 

42 

51 

70 

47 

67 

Moore 

52 

42 

53 

87 

85 

Brunner 

36 

70 

62 

44 

79 

Wolf 

34 

59 

39 

78 

61 


Cantidad del préstamo 
(miles de dólares) 


Ejecutivo 

1 

2 

3 

4 

5 

Bowyer 

66 

80 

54 

68 

52 

Kuhlman 

74 

43 

45 

65 

49 

Ludwig 

75 

53 

68 

50 

31 

Longnecker 

42 

65 

70 

41 

52 

Simonetti 

43 

38 

10 

19 

47 


25 . El fabricante de una barra de dulce, llamada “A Rod”, informa en el paquete que el contenido caló- 
rico de una barra de 2 onzas es de 420 unidades. Una muestra de 5 barras de cada uno de los 
últimos 10 días se somete a un análisis químico de contenido calórico. Los resultados aparecen 
en la siguiente tabla. ¿Parece que hay algunos días en los cuales el conteo de las calorías está 
fuera de control? Desarrolle una gráfica de control apropiada y analice sus resultados. 


Ejercicios del capítulo 
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Conteo calórico 


Muestra 

1 

2 

3 

4 

5 

1 

426 

406 

418 

431 

432 

2 

421 

422 

415 

412 

411 

3 

425 

420 

406 

409 

414 

4 

424 

419 

402 

400 

417 

5 

421 

408 

423 

410 

421 


Conteo calórico 


Muestra 

1 

2 

3 

4 

5 

6 

427 

417 

408 

418 

422 

7 

422 

417 

426 

435 

426 

8 

419 

417 

412 

415 

417 

9 

417 

432 

417 

416 

422 

10 

420 

422 

421 

415 

422 


26. Early Morning Delivery Service garantiza la entrega de paquetes pequeños a las 10:30 a.m. Por 
supuesto, algunos paquetes no se entregan a las 10:30 a.m. En una muestra de 200 paquetes 
entregados cada uno de los últimos 15 días laborables, el siguiente número de paquetes se entre- 
gó después del límite de tiempo: 9, 14, 2, 13, 9, 5, 9, 3, 4, 3, 4, 3, 3, 8 y 4. 

a) Determine la proporción media de los paquetes que se entregaron después de las 10:30 a.m. 

b) Determine los límites de control de la proporción de paquetes que se entregaron después de 
las 10:30 a.m. ¿Hubo algunos días muestreados fuera de control? 

c) En una muestra, si 1 0 paquetes de 200 se entregaron hoy después de las 1 0:30 a.m., ¿la mues- 
tra está dentro de los límites de control? 

27. Una máquina automática produce pernos de 5 milímetros a alta velocidad. Se Inició un programa 
de control de calidad para controlar el número de pernos defectuosos. El inspector de control de 
calidad selecciona 50 pernos al azar y determina cuántos son defectuosos. El número de pernos 
defectuosos en la primera de 10 muestras es 3, 5, 0, 4, 1, 2, 6, 5, 7 y 7. 

a) Diseñe un diagrama del porcentaje defectuoso. Intercale el porcentaje medio defectuoso entre 
LCS Y LCI. 

b) Trace en el diagrama el porcentaje defectuoso de las primeras 10 muestras. 

c) Interprete el diagrama. 

28. Steele Breakfast Foods, Inc., produce una popular marca de cereal de salvado con pasas. El 
paquete indica que contiene 25.0 onzas de cereal. Para asegurar la calidad, el departamento de 
calidad de Steele verifica cada hora el proceso de producción. Como parte de la verificación, se 
seleccionan 4 cajas de cereal para pesar su contenido. Los siguientes son los resultados. 


Muestra 


Pesos 


Muestra 


Pesos 


1 

26.1 

24.4 

25.6 

25.2 

14 

23.1 

23.3 

24.4 

24.7 

2 

25.2 

25.9 

25.1 

24.8 

15 

24.6 

25.1 

24.0 

25.3 

3 

25.6 

24.5 

25.7 

25.1 

16 

24.4 

24.4 

22.8 

23.4 

4 

25.5 

26.8 

25.1 

25.0 

17 

25.1 

24.1 

23.9 

26.2 

5 

25.2 

25.2 

26.3 

25.7 

18 

24.5 

24.5 

26.0 

26.2 

6 

26.6 

24.1 

25.5 

24.0 

19 

25.3 

27.5 

24.3 

25.5 

7 

27.6 

26.0 

24.9 

25.3 

20 

24.6 

25.3 

25.5 

24.3 

8 

24.5 

23.1 

23.9 

24.7 

21 

24.9 

24.4 

25.4 

24.8 

9 

24.1 

25.0 

23.5 

24.9 

22 

25.7 

24.6 

26.8 

26.9 

10 

25.8 

25.7 

24.3 

27.3 

23 

24.8 

24.3 

25.0 

27.2 

11 

22.5 

23.0 

23.7 

24.0 

24 

25.4 

25.9 

26.6 

24.8 

12 

24.5 

24.8 

23.2 

24.2 

25 

26.2 

23.5 

23.7 

25.0 

13 

24.4 

24.5 

25.9 

25.5 







Elabore un diagrama de control apropiado. ¿Cuáles son los límites? ¿Está fuera de control el pro- 
ceso en algún momento? 

29. Un inversionista considera que hay una posibilidad de 50% de que una acción suba o baje en un 
día en particular. Para investigar esta idea, durante 30 días consecutivos el inversionista seleccio- 
na una muestra de 50 acciones y cuenta el número de veces que aumenta. El siguiente es el núme- 
ro de acciones de ia muestra que aumentaron. 


14 

12 

13 

17 

10 

18 

10 

13 

13 

14 

13 

10 

12 

11 

9 

13 

14 

11 

12 

11 

15 

13 

10 

16 

10 

11 

12 

15 

13 

10 
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CAPÍTUL0 19 Control estadístico del proceso y administración de calidad 


Elabore un diagrama del porcentaje defectuoso y resuma sus resultados en un reporte breve. Con 
base en los resultados, ¿es razonable concluir que las probabilidades de que la acción aumente 
son de 50%? ¿Qué porcentaje de las acciones necesitaría subir en un día para que el proceso esté 
“fuera de control”? 

30 . Lahey Motors se especializa en vender automóviles a compradores con un historial crediticio defi- 
ciente. Los siguientes son los números de automóviles que se recuperaron debido a que los clien- 
tes de Lahey no cumplieron con sus pagos durante los últimos 36 meses. ^ 


6 

5 

8 

20 

11 

10 

9 

3 

9 

9 

15 

12 

4 

11 

9 

9 

6 

18 

6 

8 

9 

7 

13 

7 

11 

8 

11 

13 

6 

14 

13 

5 

5 

8 

10 

11 






Elabore un diagrama de líneas c del número de recuperaciones. ¿Hubo algunos meses en que el 
número estuvo fuera de control? Resuma sus resultados en un reporte breve. 

31 . Un ingeniero de proceso considera dos planes de muestreo. De acuerdo con el primero seleccio- 
nará una muestra de 10 y aceptará el lote si 3 o menos son defectuosas. En el segundo, el tama- 
ño de la muestra es 20, y el número de aceptación, 5. Elabore la curva CO de cada uno. Compare 
la probabilidad de aceptación de lotes con 5, 10, 20 y 30% de unidades defectuosas. Si usted 
fuera el proveedor, ¿qué plan recomendaría? 

32 . Christina Sanders es miembro del equipo femenil de basquetbol del Windy City College. La tem- 
porada pasada anotó 55% de sus intentos de tiros libres. En un esfuerzo por mejorar dicha esta- 
dística, asistió a un curso de verano dedicado a enseñar técnicas de tiros libres. Los siguientes 20 
días tiró 100 tiros libres al día. Con minuciosidad, registró el número de tiros anotados cada día. 
Los resultados son los siguientes. ^ 


55 

61 

52 

59 

67 

57 

61 

59 

69 

58 

57 

66 

63 

63 

63 

65 

63 

68 

64 

67 


La interpretación de la tabla es que el primer día anotó 55 tiros de 100, o 55%. El último día anotó 
67 de 100, o 67 por ciento. 

a) Elabore el diagrama de control de los tiros anotados. Durante los 20 días de práctica, ¿cuál fue 
el porcentaje de tiros que anotó? ¿Cuáles son los límites de control superior e inferior de la pro- 
porción de tiros anotados? 

b) ¿Hay alguna tendencia en su proporción de tiros anotados? ¿Parece mejorar, empeorar o per- 
manece igual? 

c) Encuentre el porcentaje de intentos anotados durante los últimos cinco días de práctica. Utilice 
el procedimiento de prueba de hipótesis, fórmula (10-4), para determinar si hay una mejora a 
partir de 55 por ciento. 

33 . Eric’s Cookie House vende galletas con chispas de chocolate en centros comerciales. Le interesa 
conocer el número de chispas de chocolate en cada galleta. Eric, propietario y presidente, quiere 
establecer un diagrama de control del número de chispas por galleta, para lo cual selecciona una 
muestra de 15 unidades de la producción de hoy y cuenta el número de chispas en cada una de 
ellas. Los resultados son los siguientes: 6, 8, 20, 12, 20, 19, 1 1 , 23, 12, 14, 15, 16, 12, 13 y 12. 

a) Determine la línea central y los límites de control. 

ib) Desarrolle un diagrama de control y trace el número de chispas de chocolate por galleta, 
c) Interprete el diagrama. ¿Parece que el número de chispas de chocolate está fuera de control 
en alguna de las galletas muestreadas? 

34 . El número de ocasiones en que “los pasajeros casi pierden el vuelo” durante los últimos 20 meses 
en el Aeropuerto Internacional de Lima, Perú, es 3, 2, 3, 2, 2, 3, 5, 1 , 2, 2, 4, 4, 2, 6, 3, 5, 2, 5, 1 y 3. 
Desarrolle un diagrama de control apropiado. Determine el número medio de pasajeros que casi pier- 
den el vuelo por mes y los límites del número de pasajeros que casi pierden el vuelo por mes. ¿Hay 
algún mes en que el número de pasajeros que casi pierden el vuelo esté fuera de control? ^ 

35 . El siguiente es el número de robos reportado durante los últimos 10 días a la división de robos de 
Metro City Pólice: 10, 8, 8, 7, 8, 5, 8, 5, 4 y 7. Elabore un diagrama de control apropiado. Determine 
el número medio de robos reportado por día y los límites de control. ¿Hay días en que el número 
de robos reportado esté fuera de control? 

36 . Swiss Watches, Ltd., compra vástagos para relojes en lotes de 10 000. Su plan de muestreo 
requiere 20 vástagos, y si 3 o menos son defectuosos, se acepta el lote. 


Comandos de software 
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a) Con base en el plan de muestreo, ¿cuál es la probabilidad que se acepte un lote con 40% de 
defectos? 

¿>) Diseñe la curva CO de lotes de entrada que tenga 0, 10, 20, 30 y 40% de vástagos defectuo- 
sos. 

37 . Automatic Screen Door Manufacturing compra picaportes a diversos proveedores. El departamen- 
to de compras es el responsable de inspeccionar los picaportes de entrada. La compañía compra 
10 000 picaportes por mes e inspecciona 20 al azar. Elabore una curva OC del plan de muestreo 
si tres picaportes son defectuosos y aún se acepta el lote de entrada. 

38 . Al inicio de cada temporada de fútbol, Team Sports, tienda local de artículos deportivos, compra 
5 000 balones. Se selecciona una muestra de 25 balones y se inflan, prueban y luego se desinflan. 
Si más de dos balones son defectuosos, todo el lote se regresa al fabricante. Elabore la curva OC 
de este plan de muestreo. 

a) ¿Cuáles son las probabilidades de aceptar lotes con 10, 20, 30% de unidades defectuosas? 

b) Estime la probabilidad de aceptar un lote con 15% de unidades defectuosas. 

c) John Brennen, propietario de Team Sports, quiere que la probabilidad de aceptar un lote con 
5% de defectos sea de 90%. ¿Parece ser el caso con este plan de muestreo? 


Comandos de software 


1. Los comandos en MINITAB del diagrama de Pareto de la 

página 727 son: 

a) Escriba las razones del consumo de agua en la columna 
C1 y los galones consumidos en C2. Dé nombres apro- 
piados a las columnas. 

b) Haga clic en Stat, Quality Tools, Pareto Chart y luego 
oprima Enter. 

c) Seleccione Chart defects table, indique la ubicación de 
las clasificaciones y frecuencias, haga clic en Options y 
escriba un título de la gráfica; después haga clic en OK. 



2. Los comandos en Minitab de la barra X y las gráficas R de la 

página 734 son: 

a) Escriba la información de la tabla 19-1. Recupere los 
datos del sitio web del libro: www.mhhe.com/lind15e. El 
nombre del archivo es Table 19-1. 

b) Haga clic en Stat, Control Charts, Variables Charts for 
Subgroups, Xbar-R y oprima Enter. 

c) Seleccione All observations for a chart are in one 
column. En el cuadro inferior, seleccione la variable 
Minutes. 


3 . Los comandos en Minitab de la gráfica del porcentaje defec- 
tuoso de la página 739 son: 

a) Escriba los datos sobre el número de defectos de la 
página 738. 

b) Haga clic en Stat, Control Charts, Attribute Charts, P 
y oprima Enter. 

c) En Variables, seleccione Defects, luego escriba 50 para 
Subgroup sizes. Haga clic en Labels, escriba el título y 
haga clic en OK dos veces. 
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4. Los comandos en Minitab para la gráfica de barras c de la 

página 741 son: 

a) Escriba los datos del número de palabras mal escritas 
de la página 740. 

b) Haga clic en Stat, Control Charts, Attribute Charts, C 
y oprima Enter. 

c) Seleccione Variable e indique el número de palabras 
mal escritas, luego haga clic en Labels y escriba el títu- 
lo en el espacio proporcionado; después, haga clic en 
OK dos veces. 



Capítulo 19 


Respuestas a las autoevaluaciones 



19-1 
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LCS 


11 


LCI 


LCI = D 3 R = 0(4) = 0 
LCS = D 4 R = 2.282(4) = 9.128 


Setenta y tres por ciento de las quejas son por alimentos 
malos, atención deficiente o condiciones insalubres. 

Éstos son los factores que el administrador debe corregir. 

19-2 a) 


Veces de la muestra 




1 2 

3 4 

Total 

Promedio 

Rango 

1 4 

5 2 

12 

3 

4 

2 3 

2 1 

8 

2 

2 

1 7 

3 5 

16 

4 

6 




9 

12 


^ = f = 3 

R = 

b* 



LCS y LCI 

= X± 

A 2 R 




= 3 ± 

0.729(4) 



LCS = 5.916 

LCI 

= 0.084 



Gráfica de rangos 



Hora (a.m.) 


b) Sí. Tanto la gráfica de la media como la gráfica del 
rango indican que el proceso está bajo control. 

19-3 c = = 2.083 

12 

LCS= 2.083 + 3VZ083 = 6.413 

LCI = 2.083 - 3VZ083 = -2.247 

Como LCI es negativo, se establece LCI = 0. El turno con 
7 defectos está fuera de control. 

19-4 P(X< 2|tt = .30 y n = 20) = .036 



Introducción a la teoría 
de decisiones 


Objetivos de 
aprendizaje 

Al concluir el capítulo, será 
capaz de: 



OA1 Identificar y aplicar los 
tres componentes de una 
decisión. 

OA2 Calcular e interpretar los 
valores esperados de una 
tabla de pagos. 

OA3 Explicar e interpretar la 
pérdida de oportunidad. 

OA4 Describir tres estrategias 
de la toma de decisiones. 

OA5 Calcular y describir el 
valor esperado de la 
información perfecta. 

OA6 Organizar los posibles 
resultados en un árbol de 
decisión e interpretar el 
resultado. 


Blackbeard’s Phantom Fireworks considera introducir dos nuevos 
cohetes de botella. La compañía puede agregar los dos a la línea 
actual, ninguno o sólo uno de ellos. El éxito de estos productos 
depende de los consumidores. Sus reacciones se resumen como 
“buena”, “regular” o “mala”. Los ingresos de la compañía, en miles de 
dólares, se estiman en la tabla de pagos del ejercicio 1 1 . Calcule el 
valor monetario esperado de cada decisión. (Vea ejercicio 1 1 a, 
objetivo 2.) 
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CAPÍTULO 20 Introducción a la teoría de decisiones 


OA1 Identificar y aplicar los 
tres componentes de una 
decisión. 


20.1 Introducción 

Al inicio de la década de 1950 se desarrolló una rama de la estadística denominada teoría 
estadística de decisiones, que se apoya en la probabilidad. Como su nombre lo indica, se 
enfoca en el proceso de toma de decisiones, e incluye de manera explícita los pagos mone- 
tarios que pueden resultar. En contraste, la estadística clásica se enfoca en estimar un pará- 
metro, como la media de la población, determinar un intervalo de confianza o realizar una 
prueba de hipótesis. La estadística clásica no aborda las consecuencias financieras. 

La teoría de las decisiones estadísticas se relaciona con determinar, a partir de un conjun- 
to de alternativas posibles, cuál es la decisión óptima ante un conjunto particular de condicio- 
nes. Considere los siguientes ejemplos de problemas de la teoría de toma de decisiones. 

• Ford Motor Company debe decidir si compra las cerraduras ensambladas para las puer- 
tas de la camioneta Ford F-150 Harley-Davidson modelo 2010 o fabricar y ensamblar las 

cerraduras en su planta en Sandusky, Ohio. 
Si las ventas de la camioneta continúan en 
aumento, sería más rentable fabricar y 
ensamblar las partes. Pero si se estabilizan 
o declinan, sería más rentable comprarlas 
para colocarlas en las puertas ensambla- 
das. ¿Debe Ford fabricar o comprar las 
cerraduras? 

• Banana Republic desarrolló una línea nueva 
de chamarras muy populares en las regio- 
nes de clima frío del país. Le gustaría com- 
prar tiempo de televisión comercial durante 
la final de basquetbol de la NCAA. Si los dos equipos que jueguen la final son de áreas 
cálidas del país, estima que sólo una proporción pequeña de los televidentes estará inte- 
resada en las chamarras. Sin embargo, un juego entre dos equipos de regiones con clima 
frío llegaría a una proporción grande de televidentes que usan chamarras. ¿Debe comprar 
tiempo de televisión comercial? 

• General Electric considera tres opciones respecto de los precios de refrigeradores para el 
próximo año. GE puede 1) aumentarlos 5%, 2) incrementarlos 2.5% o 3) dejar los mismos 
precios. La decisión final tendrá como base las estimaciones de venta y el conocimiento 
que GE tenga de lo que pueden hacer otros fabricantes de refrigeradores. 

En cada uno de estos casos, la decisión se caracteriza por las distintas opciones y los 
diversos factores que no están bajo control de quien toma las decisiones. Por ejemplo, Banana 
Republic no tiene control sobre los equipos que llegarán a la final del campeonato de basquet- 
bol de la NCAA. Estos casos caracterizan la naturaleza de la toma de decisiones. Es posible 
hacer una lista de las opciones, determinar sucesos futuros posibles e incluso establecer pro- 
babilidades, pero las decisiones se toman ante la incertidumbre. 



20.2 Elementos de una decisión 

Existen tres elementos que se deben considerar para tomar cualquier decisión: 1) las opcio- 
nes disponibles; 2) los estados de la naturaleza, que no están bajo el control de quien toma la 
decisión, y 3) los pagos. Estos conceptos se explican en los siguientes párrafos. 

Las opciones, o acciones, son las posibilidades de quien toma las decisiones. Ford 
puede tomar la decisión de fabricar y ensamblar las cerraduras para puertas en su planta en 
Sandusky o comprarlas. Para simplificar la presentación, suponga que quien toma las decisio- 
nes selecciona un pequeño número de resultados. Sin embargo, con ayuda de las computa- 
doras, las opciones de decisión se amplían a una gran cantidad de posibilidades. 

Los estados de la naturaleza son los sucesos futuros incontrolables. El estado de la 
naturaleza en realidad sucede fuera del control de quien toma la decisión. Ford no sabe si 



20.3 Un caso que supone la toma de decisiones en condiciones de incertidumbre 
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la demanda de su camioneta F-150 permanecerá alta. Banana Republic no puede determinar 
si equipos de clima cálido o frío jugarán la final de basquetbol de la NCAA. 

Es necesario un pago para comparar las combinaciones entre la opción de decisión y el 
estado de la naturaleza. Ford puede estimar que si ensambla las cerraduras de las puertas en 
su planta en Sandusky y la demanda por las camionetas F-150 baja, el pago será de $40 000. 
Si, por lo contrario, compra las cerraduras ensambladas y la demanda es alta, el pago estima- 
do es de $22 000. 

Los elementos principales de una decisión en condiciones de incertidumbre se identifican 
de manera esquemática: 


Explicaciones 



{ Incertidumbre respecto de la demanda futura. 

Estado de la naturaleza (demanda futura) desconocido. 

Quien toma la decisión no tiene control sobre el estado de la naturaleza. 

' Dos o más cursos de acción abiertos para quien toma la decisión. 

Quien toma la decisión debe evaluar opciones. 

Quien toma la decisión selecciona un curso de acción con base en ciertos criterios. 
Según el conjunto de circunstancias, estos criterios pueden ser cuantitativos, 

. psicológicos, sociológicos, etcétera. 

{ Ganancia. 

Equilibrio. 

Pérdida. 


En muchos casos es posible mejorar la toma de decisiones si se establecen probabilida- 
des para los estados de la naturaleza, las cuales pueden tener como base datos históricos o 
estimaciones subjetivas. Ford puede estimar la probabilidad de una demanda alta continua 
como 0.70. GE puede estimar que la probabilidad de que Amana y otros fabricantes aumen- 
ten los precios de sus refrigeradores será de 0.25. 


20.3 Un caso que supone la toma de decisiones 
en condiciones de incertidumbre 

Desde ahora hay que destacar que esta descripción de caso sólo incluye los conceptos fun- 
damentales de la toma de decisiones. El propósito de examinar el caso es explicar el proce- 
dimiento lógico. El primer paso es establecer una tabla de pagos. 


Tabla de pagos 

Bob Hill, un inversionista pequeño, tiene $1 100 que desea invertir, para lo cual estudió varias 
acciones comunes y redujo sus opciones a tres: Kayser Chemicals, Rim Homes y Texas 
Electronics. Bob estima que, si invirtiera sus $1 100 en Kayser Chemicals y a fin del año se 
desarrolla un mercado fuerte a la alza (es decir, que haya un aumento considerable de los pre- 
cios de las acciones), el valor de sus acciones sería de más del doble, es decir, $2 400. Sin 
embargo, si hubiera un mercado a la baja (es decir, si declinan los precios de las acciones), el 
valor de sus títulos de Kayser disminuiría a $1 000 al final del año. Sus predicciones respecto 
del valor de su inversión de $1 100 en las tres acciones en un mercado a la alza y en un mer- 
cado a la baja aparecen en la tabla 20-1 . Ésta es una tabla de pagos. 
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OA2 Calcular e interpretar 
los valores esperados de una 
tabla de pagos. 


TABLA 20-1 Tabla de pagos de tres acciones comunes en dos condiciones del mercado 


Compra 

Mercado a la alza, 

s. 

Mercado a la baja, 
¡¡2 

Kayser Chemicals (A) 

$2 400 

$1 000 

Rim Homes (A 2 ) 

2 200 

1 100 

Texas Electronics (4 3 ) 

1 900 

1 150 


Las diversas opciones se denominan alternativas de decisión o acciones. En esta situa- 
ción hay tres. Sea A-, la compra de acciones de Kayser Chemical, A 2 la adquisición de títulos 
de Rim Homes y A 3 la compra de valores de Texas Electronics. Si el mercado sube o baja no 
está bajo el control de Bob HUI. Estos sucesos futuros e incontrolables son los estados de la 
naturaleza. Sea S 1 el mercado al alza y S 2 el mercado a la baja. 

Pagos esperados 

Si la tabla de pagos fuera la única información disponible, el inversionista podría tomar una 
acción conservadora y comprar acciones de Texas Electronics para estar seguro de tener al 
menos $1 150 al final del año (una ganancia pequeña). Sin embargo, una actitud especulativa 
podría implicar la compra de acciones de Kayser Chemicals, con la posibilidad de ganar más 
del doble en su inversión de $1 100. 

Cualquier decisión de compra de una de las tres acciones comunes, tomada con base 
sólo en la tabla de pagos, pasaría por alto los registros históricos de los valores que elaboran 
Moody’s, Valué Une y otros servicios de inversión acerca de los movimientos de los precios 
de acciones durante un periodo largo. Por ejemplo, un estudio de estos registros reveló que, 
durante los últimos 10 años, los precios del mercado accionarlo aumentaron seis veces y sólo 
declinaron cuatro veces. De acuerdo con esta información, la probabilidad de un aumento en 
el mercado es de 0.60, y la de una disminución, de 0.40. 

Si estas frecuencias históricas son confiables, la tabla de pagos y las estimaciones de las 
probabilidades (0.60 y 0.40) se combinan para llegar al pago esperado de comprar cada una 
de las acciones. El pago esperado también se denomina valor monetario esperado, abrevia- 
do EMV (por sus siglas en inglés). También se describe como pago medio. Los cálculos nece- 
sarios para llegar al pago esperado del suceso de comprar acciones de Kayser Chemicals 
aparecen en la tabla 20-2. 

TABLA 20-2 Pago esperado de la acción de comprar valores de Kayser Chemicals, EMV (A ] ) 


Estado de la 
naturaleza 

Pago 

Probabilidad del estado 
de la naturaleza 

Valor 

esperado 

Mercado al alza, S, 

$2 400 

.60 

$1 440 

Mercado a la baja, S 2 

1 000 

.40 

400 




$1 840 


Para explicar un cálculo del valor monetario esperado, observe que, si el inversionista 
hubiera comprado acciones de Kayser y los precios del mercado declinaran, el valor de las 
acciones sería de $1 000 al final del año (de la tabla 20-1). Sin embargo, experiencias anterio- 
res revelan que este suceso (una declinación del mercado) sólo ocurrió 40% de las veces. Por 
lo tanto, en el largo plazo, una declinación del mercado contribuiría con $400 al pago total 
esperado de las acciones, determinado mediante $1 000 X 0.40. Al sumar los $400 a los 
$1 440 esperados en condiciones de mercado a la alza se obtiene $1 840, que es el pago 
“esperado” en el largo plazo. 

Estos cálculos se resumen de la siguiente manera: 




VALOR MONETARIO ESPERADO 


EMV(A¡) = 2[P(Sj) X 1/(A¡, Sj)] 


( 20 - 1 ) 
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donde: 

EMV(/4,) se refiere al valor monetario esperado de la alternativa de decisión i. Puede haber 
muchas decisiones posibles. Se asigna 1 a la primera decisión, 2 a la segunda, 
etc. La letra minúscula i representa todo el conjunto de decisiones. 

P(Sj ) se refiere a la probabilidad de los estados de la naturaleza. Puede haber un 

número ilimitado, entonces se asigna j a este resultado posible. 

V(A ¡ , S y ) se refiere al valor de los pagos. Observe que cada pago es el resultado de una 
combinación de una alternativa de decisión y un estado de la naturaleza. 

EMV (A-¡), el valor monetario esperado de la alternativa de decisión de comprar acciones de 
Kayser Electronics, se calcula mediante: 

EMV^) = [P(S : ) X V(A„ Si)] + [P(S 2 ) X 1 /(Ai, S 2 )] 

= ,60($2 400) + ,40($1 000) = $1 840 

Comprar estas acciones es sólo una opción posible. Los pagos esperados de los suce- 
sos de comprar acciones de Kayser Chemicals, Rim Homes y Texas Electronics aparecen en 
la tabla 20-3. 

TABLA 20-3 Pagos esperados de tres acciones 


Compra 

Pago 

esperado 

Kayser Chemicals 

$1 840 

Rim Homes 

1 760 

Texas Electronics 

1 600 


Un análisis de los pagos esperados de la tabla 20-3 indica que comprar acciones de 
Kayser producirá la ganancia máxima esperada. Este resultado se basa en 1) el valor futuro 
estimado de las acciones por parte del inversionista y en 2) la experiencia histórica acerca del 
alza y la baja de los precios accionarios. Cabe destacar que, aunque comprar acciones de 
Kayser Chemicals representa la mejor acción con el criterio del valor esperado, el inversionis- 
ta aún puede decidir comprar acciones de Texas Electronics a fin de minimizar el riesgo de 
perder parte de su inversión de $1 100. 


r 


Autoevaluación 20-1 


Verifique la conclusión de la tabla 20-3, que el pago esperado del suceso de comprar acciones de 
Rim Homes es $1 760. 



Ejercicios 

1. Se obtuvo la siguiente tabla de pagos. Sea P (Si) = 0.30, P (S 2 ) = 0.50 y P (S 3 ) = 0.20. Calcule el 
valor monetario esperado de cada alternativa. ¿Qué decisión recomendaría? 


Estado de la naturaleza 


Alternativa 

Si 

S 2 

$3 

A 

$50 

$70 

$100 

a 2 

90 

40 

80 

^3 

70 

60 

90 
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OA3 Explicar e interpretar 
la pérdida de oportunidad. 


Autoevaluación 20-2 



2. Este verano, Wilhelms Cola Company planea introducir al mercado un nuevo refresco de cola con 
sabor a lima. La decisión recae sobre embotellar el refresco en envases retornables o en no retor- 
nables. En la actualidad, la legislatura estatal considera eliminar los envases no retornables. Tybo 
Wilhelms, presidente de la empresa, analizó el problema con su representante estatal y estableció 
que la probabilidad de que se eliminaran los envases no retornables es 0.70. En la siguiente tabla 
aparecen las ganancias mensuales estimadas (en miles de dólares) si el refresco se embotella en 
envases retornables o en no retornables. Por supuesto, si la ley se aprueba y la decisión es embo- 
tellar el refresco en envases no retornables, todas las ganancias provendrán de las ventas en otros 
estados. Calcule la ganancia esperada que generará cada una de las dos decisiones de embote- 
llado. ¿Qué decisión recomienda? 



Ley aprobada 

Ley no aprobada 


(miles de dólares), 

(miles de dólares), 

Alternativa 

Si 

S 2 

Envase retornable 

80 

40 

Envase no retornable 

25 

60 


Pérdida de oportunidad 

Otro método para analizar una decisión acerca de qué acciones comunes se deben comprar 
se basa en determinar la ganancia que se perdería debido al desconocimiento del estado de 
la naturaleza (el comportamiento del mercado) en el momento en que el Inversionista compró 
las acciones. Esta pérdida potencial se denomina pérdida de oportunidad, o arrepentimien- 
to. Para ilustrar esta situación, suponga que el inversionista compró las acciones comunes de 
Rlm Homes y que el mercado subió. Además, suponga que el valor de sus acciones de Rim 
Homes aumentó de $1 100 a $2 200, como se anticipó. Pero si el inversionista hubiera com- 
prado acciones de Kayser Chemicals y aumentaran los valores del mercado, el valor de sus 
acciones de Kayser Chemicals sería $2 400 (de la tabla 20-1 ). Por lo tanto, el inversionista per- 
dió la oportunidad de obtener una ganancia adicional de $200 al comprar acciones de Rim 
Homes en lugar de acciones de Kayser Chemicals. En otras palabras, los $200 representan la 
pérdida de oportunidad por no conocer el estado de la naturaleza correcto. SI los precios del 
mercado aumentan, el inversionista se arrepentiría de comprar acciones de Rim Homes. Sin 
embargo, si hubiese comprado acciones de Kayser Chemicals y los precios del mercado 
hubieran aumentado, no se habría arrepentido; es decir, no habría pérdida de oportunidad. 

Las pérdidas de oportunidad de este ejemplo se dan en la tabla 20-4. Cada cantidad es 
resultado (pérdida de oportunidad) de una combinación particular de acciones y un estado de 
la naturaleza, es decir, la compra de acciones y la reacción del mercado. 

Observe que las acciones de Kayser Chemicals serían una buena inversión en un merca- 
do al alza, Texas Electronics sería la mejor compra en un mercado a la baja, mientras que Rim 
Homes, en cierto modo, representa un punto intermedio. 


TABLA 20-4 Pérdidas de oportunidad para diversas combinaciones de compra de acciones 
y movimientos del mercado 


Compra 

Pérdida de oportunidad 

Mercado al alza 

Mercado a la baja 

Kayser Chemicals 

$ 0 

$150 

Rim Homes 

200 

50 

Texas Electronics 

500 

0 


Consulte la tabla 20-4. Verifique que la pérdida de oportunidad en el caso de: 

a) Rim Homes, con un mercado a la baja, es de $50. 

b ) Texas Electronics, con un mercado al alza, es de $500. 
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Ejercicios 

3. Consulte el ejercicio 1 . Elabore una tabla de pérdida de oportunidad. Determine la pérdida de opor- 
tunidad de cada decisión. 

4. Consulte ei ejercicio 2, referente a Wilhelms Cola Company. Elabore una tabla de pérdida de opor- 
tunidad y determine la pérdida de oportunidad de cada decisión. 

Pérdida de oportunidad esperada 

Las pérdidas de oportunidad de la tabla 20-4 pasan por alto la experiencia histórica de los 
movimientos del mercado. Recuerde que la probabilidad de un mercado al alza es 0.60, y la 
de un mercado a la baja, 0.40. Estas probabilidades y las pérdidas de oportunidad se combi- 
nan para determinar la pérdida de oportunidad esperada. En la tabla 20-5 se presentan los 
cálculos de la decisión de comprar acciones de Rim Homes. La pérdida de oportunidad espe- 
rada es de $140. 

Si interpreta lo anterior, la pérdida de oportunidad esperada de $140 significa, en el largo 
plazo, que el inversionista perdería la oportunidad de obtener una ganancia adicional de $140 
por comprar acciones de Rim Homes. Incurriría en esta pérdida esperada debido a que no pre- 
dijo con precisión la tendencia del mercado de valores. En un mercado al alza, ganaría $200 
adicionales si comprara acciones comunes de Kayser Chemicals, pero en un mercado a la 
baja, ganaría $50 adicionales si compra acciones de Texas Electronics. Cuando se ponderan 
con la probabilidad del suceso, la pérdida de oportunidad esperada es de $140. 


TABLA 20-5 Pérdida de oportunidad esperada del suceso de comprar acciones de Rim Homes 


Estado de 
la naturaleza 

Pérdida de 
oportunidad 

Probabilidad 
del estado de 
la naturaleza 

Pérdida de 
oportunidad 
esperada 

Mercado al alza, S*¡ 

$200 

.60 

$120 

Mercado a la baja, S 2 

50 

.40 

20 




$140 


Los cálculos se resumen en la ecuación siguiente: 


(pérdida DE OPORTUNIDAD ESPERADA EOL(A) = 2[P(Sj) X Ría,, Sj)] (20-2) 


donde: 

EOL(A) se refiere a la pérdida de oportunidad esperada con una decisión alternativa 
esperada. 

P(Sj) se refiere a la probabilidad asociada con los estados de la naturaleza 
R{A¡, Sj) se refiere al arrepentimiento o pérdida de una combinación particular de un esta- 
do de la naturaleza y una alternativa de la decisión. 

EOL [A 2 ), el arrepentimiento o pérdida de oportunidad esperada, al seleccionar Rim Homes, se 
calcula como sigue: 

EOL(/4 2 ) = [ P(S 0 X R(A 2 , S,)] + [P(S 2 ) X R(A 2 , S 2 )] 

= ,60($200) + ,40($50) = $140 

Las pérdidas de oportunidad esperada de las tres alternativas de la decisión se dan en la tabla 
20-6. La pérdida de oportunidad esperada menor es $60, que significa que, en promedio, el 
inversionista se arrepentiría menos si compra acciones de Kayser Chemicals. 
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TABLA 20-6 Pérdidas de oportunidad esperada de las tres acciones 


Compra 

Pérdida de 
oportunidad 
esperada 

Kayser Chemicals 

$ 60 

Rim Homes 

140 

Texas Electronics 

300 


A propósito, observe que la decisión de comprar acciones de Kayser Chemicals, debido 
a que ofrece la pérdida de oportunidad esperada menor, refuerza la decisión tomada con ante- 
rioridad: al final, las acciones de Kayser darían como resultado el pago esperado mayor 
($1 840). Estos dos enfoques (pérdida de oportunidad esperada menor y pago esperado 
mayor) siempre conducirán a la misma decisión con respecto al curso de acción. 


Autoevaluación 20-3 



Consulte la tabla 20-6 y verifique que la pérdida de oportunidad esperada del suceso de comprar 
acciones de Texas Electronics es de $300. 


Ejercicios 

5. Consulte los ejercicios 1 y 3. Calcule las pérdidas de oportunidad esperada. 

6. Consulte los ejercicios 2 y 4. Calcule las pérdidas de oportunidad esperada. 


OA4 Describir tres 
estrategias de la toma de 
decisiones. 

Estrategia maxi-min. 


Estrategia maxi-max. 


Estrategia mini-max. 


20.4 Estrategias maxi-min, maxi-max 
y mini-max de arrepentimiento 

Varios asesores financieros consideran demasiado riesgosa la compra de acciones de Kayser 
Chemicals. Hacen notar que los pagos quizá no sean de $1 840, sino de sólo $1 000 (de la 
tabla 20-1). Con el argumento de que el mercado de valores es muy impredecible, recomien- 
dan al inversionista tomar una posición más conservadora y comprar acciones de Texas 
Electronics. A esto se le denomina estrategia maxi-min: maximiza la ganancia mínima. Con 
base en la tabla de pagos (tabla 20-1), su razonamiento es que el inversionista aseguraría al 
menos una retribución de $1 150, es decir, una ganancia pequeña. Quienes adoptan esta 
estrategia un tanto pesimista a veces se les llama maximiners. 

En el otro extremo se encuentran los maximaxers optimistas, quienes seleccionarán las 
acciones que maximicen la ganancia máxima. Si se siguiera su estrategia maxi-max, el inver- 
sionista compraría acciones de Kayser Chemicals. Estos optimistas destacan la posibilidad de 
vender las acciones en el futuro por $2 400 en vez de sólo los $1 1 50 que defienden los maxi- 
miners. 

Otra fórmula es la estrategia mini-max de arrepentimiento. Los asesores que defienden 
este enfoque examinarían las pérdidas de oportunidad en la tabla 20-4 y seleccionarían las 
acciones que minimicen el arrepentimiento máximo. En este ejemplo serían las acciones de 
Kayser Chemicals, con una pérdida de oportunidad máxima de $150. Recuerde que usted 
quiere evitar pérdidas de oportunidad. Los arrepentimientos máximos fueron $200 con Rim 
Homes y $500 con Texas Electronics. 


20.5 Valor de la información perfecta 
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20.5 Valor de la información perfecta 

¿Cuánto vale la información Antes de decidir comprar acciones, el inversionista tal vez quiera considerar maneras para pre- 
“perfecta”? decir el movimiento del mercado de valores. Si supiera con precisión qué sucedería en el mer- 

cado, podría maximizar las ganancias al comprar siempre las acciones adecuadas. La pregun- 
ta es: ¿cuánto vale esta información anticipada? El valor de esta información se denomina 
valor esperado de la información perfecta, que se escribe EVPI (por sus siglas en inglés). 
En este ejemplo, significaría que Bob Hill sabría de antemano si el mercado de valores estaría 
al alza o a la baja en un futuro cercano. 

OA5 Calcular y describir el Un analista en una empresa grande de correduría, conocido de Bob, le dijo que estaría 

valor esperado de la dispuesto a proporcionarle información sobre lo que considera importante para predecir alzas 

información perfecta. y bajas del mercado. Desde luego que esta información causaría honorarios, aún indetermina- 

dos, sin importar si el inversionista la usa o no. ¿Cuál es la cantidad máxima que Bob debe 
pagar por este servicio especial? ¿$10? ¿$100? ¿$500? 

El valor de la información del analista es, en esencia, el valor esperado de la información 
perfecta, debido a que el inversionista entonces estaría seguro de comprar las acciones más 
rentables. 


VALOR DE LA INFORMACIÓN PERFECTA Diferencia entre el pago máximo en condiciones de certi- 
dumbre y el pago máximo en condiciones de incertidumbre. 


En el ejemplo anterior, este valor es la diferencia entre el valor máximo de las acciones al final 
del año en condiciones de certidumbre y el valor asociado con la decisión óptima con el cri- 
terio del valor esperado. 

Desde un punto de vista práctico, el valor esperado máximo en condiciones de certidum- 
bre significa que el inversionista compraría acciones de Kayser Chemicals si se anticipara un 
mercado al alza, y de Texas Electronics si fuera inminente un mercado a la baja. El pago espe- 
rado en condiciones de certidumbre es $1 900. (Consulte la tabla 20-7.) 


TABLA 20-7 Cálculos del pago esperado en condiciones de certidumbre 


Estado de la 
naturaleza 

Decisión 

Pago 

Probabilidad 
del estado de 
la naturaleza 

Pago 

esperado 

Mercado al alza, Si 

Comprar acciones de Kayser 

$2 400 

.60 

$1 440 

Mercado a la baja, S 2 

Comprar acciones de Texas Electronics 

1 150 

.40 

460 





$1 900 


Recuerde que si no conociera el comportamiento actual del mercado bursátil (condicio- 
nes de incertidumbre), las acciones que debería comprar serían las de Kayser Chemicals; su 
valor esperado al final del periodo se calculó en $1 840 (de la tabla 20-3). Por lo tanto, el valor 
de la información perfecta es de $60, determinado mediante: 

$1 900 Valor esperado de las acciones compradas en condiciones de certidumbre 

-1 840 Valor esperado de la compra (Kayser) en condiciones de incertidumbre 

$ 60 Valor esperado de la información perfecta 

En general, el valor esperado de la información perfecta se calcula como sigue: 


VALOR ESPERADO DE LA 
INFORMACIÓN PERFECTA 


EVPI = Valor esperado en condiciones de certidumbre 

- Valor esperado en condiciones de ¡ncertidumbre 


(20-3) 


La información del analista financiero valdría hasta $60. En esencia, el analista “garanti- 
zaría” un precio de venta en promedio de $1 900, y si el analista pidiera $40 por la informa- 
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Los pagos esperados no son 
muy sensibles. 


ción, el inversionista tendría seguridad de un pago de $1 860, determinado mediante $1 900 
- $40. Por ello, valdría la pena que el inversionista aceptara esta tarifa ($40) debido a que el 
resultado esperado ($1 860) sería mayor que el valor esperado en condiciones de incertidum- 
bre ($1 840). Sin embargo, si su conocido pidiera honorarios de $100 por su servicio, el inver- 
sionista sólo obtendría $1 800 en promedio, determinados mediante $1 900 - $100. Es lógico 
que el servicio no valdría $1 00, porque el inversionista esperaría $1 840 en promedio sin acep- 
tar este acuerdo económico. Observe que el valor esperado de la información perfecta ($60) es 
el mismo que el mínimo de los arrepentimientos esperados (tabla 20-6). Eso no sucede al azar. 



La anterior es la captura de pantalla del ejemplo del inversionista con Excel. El pago espe- 
rado y la pérdida de oportunidad esperada son iguales, como se reporta en las tablas 20-3 y 
20-6, respectivamente. Utilice la fórmula de la barra de Excel (la tecla f x ) para encontrar los 
valores esperados. En un problema más grande esto sería útil. Los cálculos en el ejemplo ante- 
rior de una inversión se mantuvieron al mínimo para destacar los términos nuevos y los proce- 
dimientos de la toma de decisión. Cuando son grandes los números de alternativas de 
decisión y de estados de la naturaleza, se recomienda utilizar un paquete estadístico o una 
hoja de cálculo. 


20.6 Análisis de sensibilidad 

En la situación anterior sobre la selección de las acciones, el conjunto de probabilidades apli- 
cadas a los valores de los pagos se derivó de la experiencia histórica con condiciones simila- 
res del mercado. No obstante, tal vez se escuche la objeción de que el comportamiento futuro 
del mercado puede ser diferente de las experiencias anteriores. A pesar de estas diferencias, 
las categorías de las alternativas de decisión con frecuencia no son muy sensibles a los cam- 
bios dentro de un rango posible. Como ejemplo, suponga que el hermano del inversionista 
considera que, en vez de una posibilidad de 60% de un alza del mercado y una posibilidad de 
0.40 de que baje, lo contrario es cierto, es decir, hay una probabilidad de 0.40 de que suba y 
una de 0.60 de que baje. Además, el primo del inversionista piensa que la probabilidad de un 
alza del mercado es 0.50, y la de una baja, 0.50. Una comparación de los pagos esperados 
originales (columna izquierda) los rendimientos esperados para el grupo de probabilidades 
sugerido por el hermano del inversionista (columna central), y los citados por el primo (colum- 
na derecha) aparece en la tabla 20-8. La decisión es la misma en los tres casos: comprar 
acciones de Kayser Chemicals. 


20.6 Análisis de sensibilidad 
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TABLA 20-8 Pagos esperados de tres conjuntos de probabilidades 


Compra 


Pagos esperados 


Experiencia histórica 
(probabilidad de 0.60 
de que suba, de 0.40 
de que baje) 

Estimación del hermano 
(probabilidad de 0.40 
de que suba, de 0.60 
de que baje) 

Estimación del primo 
(probabilidad de 0.50 
de que suba, de 0.50 
de que baje) 

Kayser Chemicals 

$1 840 

$1 560 

$1 700 

Rim Homes 

1 760 

1 540 

1 650 

Texas Electronics 

1 600 

1 450 

1 525 



Consulte la tabla 20-9 y verifique que: 

a) Los pagos esperados de Texas Electronics con el conjunto de probabilidades del hermano son 
de $1 450. 

b) TEI pago esperado de Kayser Chemicals con el conjunto de probabilidades del primo es de 
$1 700. 


Una comparación de los tres conjuntos de pagos de la tabla 20-8 revela que la mejor 
opción aún sería comprar acciones de Kayser Chemicals. Como es de esperarse, hay algunas 
diferencias entre los valores futuros esperados de cada una de las tres acciones. 

Si hay cambios drásticos en las probabilidades asignadas, los valores esperados y la deci- 
sión óptima pueden cambiar. Por ejemplo, suponga que el pronóstico de un alza del mercado 
fue de 0.20, y de una baja, de 0.80. Los pagos esperados serían como aparecen en la tabla 
20-9. En el largo plazo, lo mejor sería comprar acciones de Rim Homes. Por lo tanto, el análi- 
sis de sensibilidad permite ver cuán precisas deben ser las estimaciones de probabilidad a fin 
de sentirse cómodo con su opción. 


TABLA 20-9 Valores esperados en la compra de tres acciones 


Compra 

Pago 

esperado 

Kayser Chemicals 

$1 280 

Rim Homes 

1 320 

Texas Electronics 

1 300 



Ejercicios 

7. Consulte los ejercicios 1 , 3 y 5. Calcule el valor esperado con la información perfecta. 

8. Consulte los ejercicios 2, 4 y 6. Calcule el valor esperado con la información perfecta. 

9. Consulte el ejercicio 1 . Revise las probabilidades siguientes: P (S-,) = 0.50, P (S 2 ) = 0.20 y P (S 3 ) 
= 0.30. ¿Cambia la decisión? 

10. Consulte el ejercicio 2. Invierta las probabilidades; es decir, sea P (S-,) = 0.30 y P (S 2 ) = 0.70. 
¿Cambia su decisión? 
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Árbol de decisión: 
Representación de todos los 
resultados posibles. 

El árbol de decisión muestra 
que las acciones de Kayser 
Chemicals son la mejor 
compra. 


OA6 Organizar los posibles 
resultados en un árbol de 
decisión e interpretar el 
resultado. 


20.7 Árboles de decisión 

Una herramienta analítica que se presentó en el capítulo 5 también útil para estudiar una situa- 
ción de decisión es el árbol de decisión, una representación de todos los cursos de acción y 
resultados consecuentes posibles. Se indica en un cuadro el punto en el cual se debe tomar 
una decisión, y las ramas señalan las opciones que se deben considerar. Con referencia a la 
gráfica 20-1 , a la izquierda aparece el cuadro con tres ramas, que representan los sucesos de 
comprar acciones de Kayser Chemicals, Rim Homes y Texas Electronics. 



GRAFICA 20-1 Árbol de decisiones del inversionista 


Los tres nodos, o círculos, numerados 1 , 2 y 3, representan el pago esperado de la com- 
pra de las tres acciones. Las ramas que salen hacia la derecha de los nodos indican los even- 
tos aleatorios (mercado al alza o a la baja) y sus probabilidades correspondientes entre 
paréntesis. Los números en los extremos finales de las ramas son los valores futuros estima- 
dos al terminar el proceso de decisión en estos puntos. A esto algunas veces se le llama pago 
condicional, para denotar que el pago depende de una elección particular de acción y de un 
resultado particular de la elección. Por lo tanto, si el inversionista compra acciones de Rim 
Homes y el mercado sube, el valor condicional de las acciones sería de $2 200. 

Con el árbol de decisiones se aprecia la mejor estrategia de decisión mediante lo que se 
conoce como inducción inversa. Por ejemplo, suponga que el inversionista considera comprar 
acciones de Texas Electronics. A partir del punto inferior derecho de la gráfica 20-1, con el 
pago esperado de un mercado al alza ($1 900) contra un mercado a la baja ($1 150) y hacia 
atrás (a la izquierda), se aplican las probabilidades correspondientes para dar el pago espera- 
do de $1 600 [determinado mediante 0.60 ($1 900) + 0.40 ($1 150)]. El inversionista marcaría 
el valor esperado de $1 600 arriba del nodo 3 encerrado con un círculo, como aparece en la 
gráfica 20-1. De manera similar, determinaría los valores esperados de Rim Homes y Kayser 
Electronics. 

Si el inversionista quiere maximizar el valor esperado de su compra de acciones, preferi- 
ría $1 840 a $1 740 o $1 600. Al continuar a la izquierda hacia el cuadro, trazaría una barra 
doble “||” a través de las ramas que representan las dos opciones que rechazó (los números 2 
y 3, que representan Rim Homes y Texas Electronics). Es obvio que la rama sin la marca “||” 
que conduce al cuadro es el mejor suceso, que es comprar acciones de Kayser Chemicals. 

El valor esperado en condiciones de certidumbre también se representa por medio de un 
análisis del árbol de decisión (vea la gráfica 20-2). Recuerde que, en condiciones de certidum- 
bre, el inversionista sabría antes de comprar las acciones si el mercado de valores subirá o 
bajará. Entonces compraría acciones de Kayser Chemicals en un mercado al alza y de Texas 
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Electronics en un mercado a la baja, y el pago esperado sería $1 900, que se obtiene de 
2 400(.60) +1 150(.40). Una vez más, se utiliza la inducción inversa para llegar al pago espe- 
rado de $1 900. 


Si se dispone de información 
perfecta: comprar acciones de 
Kayser Chemicals en un mer- 
cado al alza; comprar accio- 
nes de Texas Electronics en 
un mercado a la baja. 



GRAFICA 20-2 Árbol de decisión con información perfecta 

La diferencia monetaria con base en la información perfecta de la gráfica 20-2 y la deci- 
sión basada en la información perfecta de la gráfica 20-1 es de $60, cantidad determinada 
mediante la resta $1 900 - $1 840. Recuerde que $60 es el valor esperado de la información 
perfecta. 

El análisis del árbol de decisión ofrece otra forma de realizar los cálculos que se presen- 
taron antes en este capítulo. Algunos administradores consideran útiles estos bocetos gráfi- 
cos para seguir la lógica de decisión. 


Resumen del capítulo 

I. La teoría de las decisiones estadísticas se enfoca en la toma de decisiones ante un conjunto de 
opciones. 

A. Los diversos cursos de acción se denominan acciones o alternativas. 

B. Los sucesos futuros incontrolables se denominan estados de la naturaleza. En general, las pro- 
babilidades se asignan a los estados de la naturaleza. 

C. La consecuencia de una alternativa de decisión particular y del estado de la naturaleza se deno- 
mina pago. 

D. Todas las combinaciones posibles de las alternativas de decisión y de los estados de la natura- 
leza generan una tabla de pagos. 

II. Existen varios criterios para seleccionar la mejor alternativa de decisión. 

A. En el criterio del valor monetario esperado (EMV), se calcula el valor esperado de cada alterna- 
tiva de decisión y se selecciona el óptimo (el mayor si son ganancias, el menor si son costos). 

B. Se puede elaborar una tabla de pérdida de oportunidad. 

1. Una tabla de pérdida de oportunidad se elabora con la diferencia entre la decisión óptima 
de cada estado de la naturaleza y las demás alternativas de decisión. 

2. La diferencia entre la decisión óptima y cualquier otra decisión es la pérdida de oportunidad 
o arrepentimiento a causa de una decisión distinta a la óptima. 

3. La pérdida de oportunidad esperada (EOL) es similar al valor monetario esperado. La pérdi- 
da de oportunidad se combina con las probabilidades de los diversos estados de la natura- 
leza en cada alternativa de decisión para determinar la pérdida de oportunidad esperada. 

C. A la estrategia de maximizar la ganancia mínima se le conoce como maxi-min. 

D. A la estrategia de maximizar la ganancia máxima se le denomina maxi-max. 

E. La estrategia que minimiza la pérdida máxima se designa arrepentimiento mini-max. 

III. El valor esperado de la información perfecta (EVPI) es la diferencia entre el mejor pago esperado en 
condiciones de certidumbre y el mejor pago esperado en condiciones de incertidumbre. 

IV. El análisis de sensibilidad examina los efectos de varias probabilidades de los estados de la natu- 
raleza sobre los valores esperados. 

V. Los árboles de decisión son útiles para estructurar las diversas opciones. Son representaciones de 
los cursos de acción y estados de la naturaleza posibles. 
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Ejercicios del capítulo 

11. Blackbeard’s Phantom Fireworks considera introducir dos nuevos cohetes de botella. La compa- 
ñía puede agregar los dos a la línea actual, ninguno o sólo uno de ellos. El éxito de estos produc- 
tos depende de los consumidores. Sus reacciones se resumen como “buena”, P (S-,) = 0.30; 
“regular”, P (S 2 ) = 0.50 o “mala”, P (S 3 )= 0.20. Los ingresos de la compañía, en miles de dólares, 
se estiman en la siguiente tabla de pagos. 



Estado de la naturaleza 

Decisión 

s^ 

S, 2 

s 3 

Ninguno 

0 

0 

0 

Sólo el producto 1 

125 

65 

30 

Sólo el producto 2 

105 

60 

30 

Los dos 

220 

110 

40 


a) Calcule el valor monetario esperado de cada decisión. 

b) ¿Qué decisión recomendaría? 

c) Elabore una tabla de pérdida de oportunidad. 

d) Calcule la pérdida de oportunidad esperada de cada decisión. 

e) Calcule el valor esperado de la información perfecta. 

12. Una ejecutiva financiera de Fidelity Investments vive en Boston, pero con frecuencia debe viajar a 
Nueva York. Puede ir a Nueva York en automóvil, tren o avión. El costo de un boleto en avión de 
Boston a Nueva York es de $200, y se estima que el viaje dura 30 minutos con buen clima y 45 
con mai clima. El costo de un boleto de tren es de $100, y el viaje dura una hora con buen clima 
y dos horas con mal clima. El costo de conducir su propio automóvil es de $40, y su duración es 
de tres horas con buen clima y cuatro con mal clima. La ejecutiva asigna un valor de $60 por hora 
a su tiempo. El pronóstico del clima para mañana es 60% posibilidad de mal clima. ¿Qué decisión 
recomendaría? ( Sugerencia : establezca una tabla de pagos y recuerde que quiere minimizar los 
costos.) ¿Cuál es el valor esperado de la información perfecta? 

13. Thomas Manufacturing Company dispone de $100 000 para invertir. John Thomas, presidente y 
director ejecutivo de la compañía, quiere ampliar la producción, invertir el dinero en acciones o 
comprar un certificado de depósito del banco. Por supuesto, la incógnita es si la economía conti- 
nuará en un nivel alto o habrá una recesión. Estima la posibilidad de recesión en 0.20. Si hay rece- 
sión o no, el certificado de depósito generará una ganancia de 6%. Si hay una recesión, anticipa 
una pérdida de 10% si amplía su producción y una pérdida de 5% si invierte en acciones. Si no 
hay recesión, una ampliación de la producción generará una ganancia de 15%, y la inversión en 
acciones, una ganancia de 12 por ciento. 

a) ¿Qué decisión debe tomar con ia estrategia maxi-min? 

b) ¿Qué decisión debe tomar John Thomas si utiliza la estrategia maxi-max? 

c) ¿Qué decisión tomaría si utiliza el criterio del valor monetario esperado? 

d) ¿Cuál es el valor esperado de la información perfecta? 

14. El departamento de calidad de Malcomb Products debe inspeccionar cada parte en un lote o no 
inspeccionar ninguna de ellas. Es decir, hay dos alternativas de decisión: inspeccionar todas las 
partes o no inspeccionar ninguna. La proporción de partes defectuosas en el lote, S y , se conoce 
por datos históricos y asume la siguiente distribución de probabilidad. 


Estado de la 


naturaleza, 

Probabilidad 

Sj 

P(Sj) 

.02 

.70 

.04 

.20 

.06 

.10 
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En el caso de la decisión de no inspeccionar ninguna parte, el costo de calidad es C = NSjK. Por 
inspeccionar todas las partes del lote es C = Nk, donde: 

N = 20 (tamaño del lote) 

K = $18.00 (el costo de encontrar un defecto) 

k = $0.50 (el costo de muestreo de una parte) 

a) Elabore una tabla de pagos. 

£>) ¿Qué decisión se debe tomar con el criterio del valor esperado? 

c) ¿Cuál es el valor esperado de la información perfecta? 

15. Dude Ranches Incorporated se fundó con la idea de que muchas familias, en las áreas del este y 
sur de Estados Unidos, no tienen suficiente tiempo de vacaciones para viajar en automóvil a los 
ranchos turísticos de las áreas del suroeste y las Montañas Rocallosas. Sin embargo, varias 
encuestas indican que hay mucho interés en este tipo de vacaciones familiares, para montar a 
caballo, arrear ganado, nadar, pescar y realizar actividades similares. Dude Ranches Incorporated 
compró una granja grande cerca de varias ciudades del este y construyó un lago, una alberca y 
otras instalaciones. No obstante, para construir cierta cantidad de cabañas familiares en el rancho 
hace falta una inversión considerable. Además, los propietarios argumentaron que la mayoría de 
su inversión se perdería si el complejo del rancho fuera un fracaso económico. En cambio, deci- 
dieron llegar a un acuerdo con Mobile Homes Manufacturing Company para que les suministrara 
una casa móvil auténtica y muy atractiva tipo rancho. Mobile Homes acordó entregar una casa 
móvil el sábado por $300 a la semana. Mobile Homes debe saber el sábado por la mañana cuán- 
tas casas móviles quiere Dude Ranches Incorporated para la semana siguiente. Tiene que atender 
otros clientes y sólo puede entregar las casas a Dude Ranches el sábado. Esto representa un pro- 
blema, pues Dude Ranches tendrá algunas reservaciones para el sábado pero hay indicaciones de 
que muchas familias no hacen reservaciones. En lugar de eso, prefieren examinar las instalacio- 
nes antes de tomar una decisión. Un análisis de los diversos costos indicó que se debe cobrar 
$350 por semana por una casa tipo rancho, con todos los servicios. El problema básico es cuán- 
tas casas móviles ordenar a Mobile Homes cada semana. ¿Debe pedir Dude Ranches 10 (consi- 
derado el mínimo), 11, 12, 13o 14 (considerado el máximo) casas móviles? 

Sin embargo, cualquier decisión tomada sólo con base en la información de la tabla de pagos 
pasaría por alto la valiosa experiencia que Dude Ranches adquirió en los cuatro años anteriores 
(aproximadamente 200 semanas) operando un rancho para turistas en el suroeste. Sus registros 
revelaron que siempre tenían nueve reservaciones. Asimismo, nunca tuvo una demanda por 15 o 
más cabañas. La ocupación de 10, 11, 12, 13 o 14 cabañas, en parte, representó familias que lle- 
garon a inspeccionar las instalaciones antes de rentar una cabaña. En la siguiente tabla aparece 
la distribución de la frecuencia con el número de semanas en que se rentaron 10, 11 14 caba- 

ñas durante el periodo de 200 semanas. 


Número de 
cabañas 
rentadas 

Número de 

semanas 

10 

26 

11 

50 

12 

60 

13 

44 

14 

20 


200 


a) Elabore una tabla de pagos. 

£>) Determine los pagos esperados y tome una decisión. 

c) Elabore una tabla de pérdida de oportunidad. 

d) Calcule las pérdidas de oportunidad esperada y tome una decisión. 

e) Determine el valor esperado de la información perfecta. 

16. El propietario del recién construido White Mountain Ski and Swim Lodge considera comprar o ren- 
tar varias motonieves para uso de los huéspedes. El dueño descubrió que otras obligaciones 
financieras hacían imposible comprar las unidades. Snowmobiles Incorporated (SI) rentará una 
máquina por $20 a la semana, con servicio de mantenimiento. De acuerdo con Snowmobiles, el 
cargo habitual por renta a los huéspedes del hotel es de $25 a la semana. Los cargos por gasoli- 
na y aceite son adicionales. Snowmobiles Incorporated sólo renta una máquina para toda la tem- 
porada. El propietario de Ski and Swim sabe que el arrendamiento de un número excesivo de 
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motonieves puede ocasionar una pérdida neta para el hotel, e investigó los registros de otros pro- 
pietarios de centros vacacionales. La experiencia combinada en varios hoteles resultó ser: 


Número de 


motonieves demandado 

Número de 

por los huéspedes 

semanas 

7 

10 

8 

25 

9 

45 

10 

20 


a) Diseñe una tabla de pagos. 

b) Calcule los pagos esperados por arrendar 7, 8, 9 y 10 motonieves con base en el costo de 
arrendamiento de $20, la tarifa de renta de $25 y la experiencia de otros hoteles. 

c) ¿Cuál es la alternativa más rentable? 

d) Diseñe una tabla de pérdida de oportunidad. 

e) Encuentre las pérdidas de oportunidad esperada de rentar 7, 8, 9 y 10 motonieves. 

f) ¿Qué acción da la menor pérdida de oportunidad? 

g) Determine el valor esperado de la información esperada. 

h) Sugiera un curso de acción para el propietario de Ski and Swim Lodge. Incluya en su explica- 
ción las diversas cifras, como el pago esperado. 

17. Casual Furniture World recibió muchas consultas acerca de la disponibilidad de mobiliario y equipo 
que podría rentarse para fiestas al aire libre en verano. Esto incluye sillas y mesas plegables, una 
parrilla de lujo, gas propano e iluminación. En el ámbito local no hay posibilidad de rentar equipo 
de este tipo, y la gerencia de la mueblería considera establecer una subsidiaria que maneje la renta. 

Una investigación reveló que la mayoría de las personas interesadas en rentar quiere un juego 
completo de elementos para las fiestas (más o menos 12 sillas, cuatro mesas, una parrilla de lujo, un 
tanque de gas propano, tenazas, etc.). La gerencia decidió no comprar un número grande de juegos 
completos debido al riesgo financiero. Es decir, si la demanda de los grupos de renta no fuera tan 
grande como se anticipó, se incurriría en una pérdida financiera considerable. Además, la compra en 
firme significaría que el equipo tendría que almacenarse durante los días fuera de temporada. 

Entonces se descubrió que una compañía en Boston rentaba un juego completo para fiestas 
por $560 para toda la temporada de verano. Esto equivale a $5 por día. En la información promo- 
cional de la compañía de Boston, se sugiere una tarifa de arrendamiento de $15. Por lo tanto, por 
cada juego rentado se obtendría una ganancia de $10. Luego se decidió rentar en la compañía de 
Boston, al menos durante la primera temporada. 

La compañía de Boston sugirió que, con base en la experiencia combinada de compañías de 
renta similares en otras ciudades, se rentarían 41 , 42, 43, 44, 45 o 46 juegos completos durante la 
temporada. Con base en esta sugerencia, ahora la gerencia debe tomar la decisión sobre el núme- 
ro más redituable de juegos completos para rentar en la temporada. 

La compañía de Boston también proporcionó a la recién formada subsidiaria información adi- 
cional de varias compañías de renta. Observe en la siguiente tabla (que tiene como base la expe- 
riencia de las otras compañías de renta) que, para 360 días de un total de 6 000 de experiencia, 
casi 6% de los días, estas compañías de renta arrendaron 41 juegos completos para fiestas. En 
10% de los días durante un verano habitual, rentaron 42 juegos completos, etcétera. 


Número de 
juegos rentados 

Número 
de días 

Número de 
juegos rentados 

Número 
de días 

40 

0 

44 

2 400 

41 

360 

45 

1 500 

42 

600 

46 

300 

43 

840 

47 

0 


a) Elabore una tabla de pagos. (Como cifra de comprobación, para la acción de tener 41 juegos 
completos disponibles y para la acción de rentar 41, el pago es de $410.) 

b) El pago diario esperado de rentar 43 juegos completos de la compañía de Boston es de 
$426.70; en el caso de 45 juegos, $431 .70, y en el de 46 juegos, $427.45. Organice estos pagos 
diarios esperados en una tabla y complétela con el pago diario esperado de rentar 41 , 42 y 44 
juegos de la compañía de Boston. 

c) Con base en el pago diario esperado, ¿cuál es la acción más rentable? 

d) La pérdida de oportunidad esperada de rentar 43 juegos para fiestas de la compañía de Boston 
es de $1 1 .60, en el caso de 45 juegos, $6.60, y en el de 46 juegos, $1 0.85. Organice estas cifras 
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en una tabla de pérdida de oportunidad esperada y complétela con la pérdida de oportunidad 
esperada de 41 , 42 y 44. 

e) De acuerdo con la tabla de pérdida de oportunidad esperada, ¿cuál es el curso de acción más 
redituable? ¿Concuerda con su decisión en el inciso c? 

f) Determine el valor esperado de la información perfecta. Explique qué indica en este problema. 

18. Tim Waltzer es propietario y administrador de Waltzer’s Wrecks, una agencia de renta de automó- 
viles de descuento cerca de Cleveland Hopkins International Airport. Renta automóviles en mal 
estado por $20 al día y tiene un arreglo con Landrum Leasing para comprar automóviles usados a 
$6 000 cada uno. Sus automóviles reciben sólo el mantenimiento necesario, como resultado, sólo 
valen $2 000 al final del año de operación. Tim decidió vender todos sus automóviles en mal esta- 
do cada año y comprar un conjunto completo de automóviles en mal estado a Landrum Leasing. 

Su contador le proporcionó una distribución de probabilidad del número de automóviles renta- 
dos por día. 


Número de automóviles rentados por dia 
20 21 22 23 

Probabilidad .10 .20 .50 .20 


Tim es un ávido jugador de golf y tenis, por lo que está en el campo de golf los fines de sema- 
na o juega tenis en canchas bajo techo. Por lo tanto, su agencia de renta de automóviles sólo abre 
entre semana. Asimismo, cierra durante dos semanas en el verano y asiste a un tour de golf. 

El contador estimó que el costo de mantenimiento mínimo y la limpieza de cada automóvil ren- 
tado es de $1.50. 

a) ¿Cuántos automóviles debe comprar para maximizar la ganancia? 

Jb) ¿Cuál es el valor esperado de la información perfecta? 

19. Usted contrata un plan de telefonía celular y le presentan la siguiente gráfica que muestra que su 
plan se “ajusta de manera automática” a los minutos que usa cada mes. Por ejemplo, si seleccio- 
na la opción 1 y usa 700 minutos el primer mes, sólo paga $79.99. Si su uso disminuye a 200 minu- 
tos el segundo mes, sólo pagará $29.99. Usted supone que usará 100, 300, 500 o 700 minutos. 
Suponga que las probabilidades de cada suceso son iguales. 


Opción 1: Inicia en $29.99 por mes 

Minutos 

Costo 

0-200 

201-700 

Más de 700 

$29.99 

$5 por cada 50 minutos 

Minutos adicionales a sólo 10c cada uno 


Opción 2: Inicia en $34.99 por mes 

Minutos 

Costo 

0-400 

401-900 

Más de 900 

$34.99 

$5 por cada 50 minutos 

Minutos adicionales a sólo 10c cada uno 


Opción 3: Inicia en $59.99 por mes 

Minutos 

Costo 

0-1 000 

1 001-1 500 

Más de 1 500 

$59.99 

$5 por cada 50 minutos 

Minutos adicionales a sólo 10c cada uno 


a) Elabore una tabla de pagos (costo) para esta decisión. 

b) Con el principio del valor monetario esperado, ¿qué decisión sugeriría? 

c) Con el enfoque optimista (costo maxi-max), ¿qué decisión sugeriría? 

d) Con la estrategia pesimista (costo maxi-min), ¿qué decisión sugeriría? 

e) Elabore una tabla de pérdida de oportunidad para esta decisión. 

f) Con la estrategia mini-max, ¿qué opción sugeriría? 

g) ¿Cuál es el valor esperado de la información perfecta? 

20. Usted está a punto de conducir a Nueva York. Si el motor de su automóvil no está afinado, el costo 
de la gasolina aumentará $100. Verificar su motor cuesta $20. Si no está afinado, las reparaciones 
cuestan $60. Antes de verificar el motor, la probabilidad de que el motor no esté afinado es de 
30%. ¿Qué debe hacer? 
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Capítulo 20 


Respuestas a las autoevaluaciones 



Suceso 

Pago 

Probabilidad 
del suceso 

Valor 

esperado 

20-4 a) 

Suceso 

Pago 

Probabilidad 
del suceso 

Valor 

esperado 

Mercado al alza 

$2 200 

.60 

$1 320 


Mercado al alza 

$1 900 

.40 

$ 760 

Mercado a la baja 

1 100 

.40 

440 


Mercado a la baja 

1 150 

.60 

690 




$1 760 





$1 450 


20-2 a) Suponga que el inversionista compró acciones de Rim 
Homes y su valor en un mercado a la baja disminuyó a 
$1 100, como se anticipó (tabla 20-1). En lugar de eso, 
si el inversionista hubiera comprado acciones de Texas 
Electronics y el mercado fuera a la baja, el valor de las 
acciones de Texas Electronics sería $1 150. La diferen- 
cia de $50, determinada mediante $1 150 - $1 100, 
representa el arrepentimiento del inversionista por 
comprar acciones de Rim Homes. 
b) Suponga que el inversionista compró acciones de 
Texas Electronics y después sube el mercado. Las 
acciones subieron a $1 900, como se anticipó (tabla 
20-1). Sin embargo, si el inversionista hubiera compra- 
do acciones de Kayser Chemicals y el valor del merca- 
do aumentara a $2 400 como se anticipó, la diferencia 
de $500 representa la ganancia adicional que el inver- 
sionista hubiera obtenido al comprar acciones de 
Kayser Chemicals. 


Suceso 

Pago 

Probabilidad 
del suceso 

Valor 
esperado 
de la 

oportunidad 

Mercado al alza 

$500 

.60 

$300 

Mercado a la baja 

0 

.40 

0 




$300 


Suceso 

Pago 

Probabilidad 
del suceso 

Valor 

esperado 

Mercado al alza 

$2 400 

.50 

$1 200 

Mercado a la baja 

1 000 

.50 

500 




$1 700 


20-5 Con probabilidades de un mercado ai alza (o a la baja) a 
0.333, las acciones de Kayser Chemicals proporcionarían 
el mayor pago esperado. Con probabilidades de 0.333 a 
0.143, las acciones de Rim Homes sería la mejor compra. 
Con probabilidades de 0.143 y menores, las acciones de 
Texas Electronics darían el mayor pago esperado. Las 
soluciones algebraicas son: 

Kayser: 2 400p + (1 - p)1 000 

Rim: 2 200p + (1 - p)1 100 

1 400p + 1 000 = 1 lOOp + 1 100 

p = .333 

Rim: 2 200p + (1 - p)1 100 

Texas: 1 900p + (1 - p)1 150 

1 lOOp + 1 100 = 750p + 1 150 

p = .143 
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Apéndice A: conjuntos de datos 

Conjunto de datos 1: Ventas inmobiliarias de Goodyear, Arizona 


Variables 

x-, = Precio de venta en miles de dólares 

x 2 = Número de recámaras 

x 3 = Tamaño de la casa en pies cuadrados 

x 4 = Alberca (1 = sí o 0 = no) 

x 5 = Distancia del centro de la ciudad en millas 

x 6 = Colonia 

x 7 = Cochera (1 = sí o 0 = no) 
x 8 = Número de baños 
1 05 casas vendidas 



* 2 

*3 

*4 

*5 

*6 

x 7 

*8 

263.1 

4 

2,300 

0 

17 

5 

1 

2.0 

182.4 

4 

2,100 

1 

19 

4 

0 

2.0 

242.1 

3 

2,300 

1 

12 

3 

0 

2.0 

213.6 

2 

2,200 

1 

16 

2 

0 

2.5 

139.9 

2 

2,100 

1 

28 

1 

0 

1.5 

245.4 

2 

2,100 

0 

12 

1 

1 

2.0 

327.2 

6 

2,500 

1 

15 

3 

1 

2.0 

271.8 

2 

2,100 

1 

9 

2 

1 

2.5 

221.1 

3 

2,300 

0 

18 

1 

0 

1.5 

266.6 

4 

2,400 

1 

13 

4 

1 

2.0 

292.4 

4 

2,100 

1 

14 

3 

1 

2.0 

209.0 

2 

1,700 

1 

8 

4 

1 

1.5 

270.8 

6 

2,500 

1 

7 

4 

1 

2.0 

246.1 

4 

2,100 

1 

18 

3 

1 

2.0 

194.4 

2 

2,300 

1 

11 

3 

0 

2.0 

281.3 

3 

2,100 

1 

16 

2 

1 

2.0 

172.7 

4 

2,200 

0 

16 

3 

0 

2.0 

207.5 

5 

2,300 

0 

21 

4 

0 

2.5 

198.9 

3 

2,200 

0 

10 

4 

1 

2.0 

209.3 

6 

1,900 

0 

15 

4 

1 

2.0 

252.3 

4 

2,600 

1 

8 

4 

1 

2.0 

192.9 

4 

1,900 

0 

14 

2 

1 

2.5 

209.3 

5 

2,100 

1 

20 

5 

0 

1.5 

345.3 

8 

2,600 

1 

9 

4 

1 

2.0 

326.3 

6 

2,100 

1 

11 

5 

1 

3.0 

173.1 

2 

2,200 

0 

21 

5 

1 

1.5 

187.0 

2 

1,900 

1 

26 

4 

0 

2.0 

257.2 

2 

2,100 

1 

9 

4 

1 

2.0 

233.0 

3 

2,200 

1 

14 

3 

1 

1.5 

180.4 

2 

2,000 

1 

11 

5 

0 

2.0 

234.0 

2 

1,700 

1 

19 

3 

1 

2.0 

207.1 

2 

2,000 

1 

11 

5 

1 

2.0 

247.7 

5 

2,400 

1 

16 

2 

1 

2.0 

166.2 

3 

2,000 

0 

16 

2 

1 

2.0 

177.1 

2 

1,900 

1 

10 

5 

1 

2.0 


(continúa) 
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Apéndice A 

A.1 Conjunto de datos 1: Ventas inmobiliarias 
de Goodyear, Arizona ( continuación ) 


*1 

*2 

*3 

*4 

*5 

*6 

*7 

*8 

182.7 

4 

2,000 

0 

14 

4 

0 

2.5 

216.0 

4 

2,300 

1 

19 

2 

0 

2.0 

312.1 

6 

2,600 

1 

7 

5 

1 

2.5 

199.8 

3 

2,100 

1 

19 

3 

1 

2.0 

273.2 

5 

2,200 

1 

16 

2 

1 

3.0 

206.0 

3 

2,100 

0 

9 

3 

0 

1.5 

232.2 

3 

1,900 

0 

16 

1 

1 

1.5 

198.3 

4 

2,100 

0 

19 

1 

1 

1.5 

205.1 

3 

2,000 

0 

20 

4 

0 

2.0 

175.6 

4 

2,300 

0 

24 

4 

1 

2.0 

307.8 

3 

2,400 

0 

21 

2 

1 

3.0 

269.2 

5 

2,200 

1 

8 

5 

1 

3.0 

224.8 

3 

2,200 

1 

17 

1 

1 

2.5 

171.6 

3 

2,000 

0 

16 

4 

0 

2.0 

216.8 

3 

2,200 

1 

15 

1 

1 

2.0 

192.6 

6 

2,200 

0 

14 

1 

0 

2.0 

236.4 

5 

2,200 

1 

20 

3 

1 

2.0 

172.4 

3 

2,200 

1 

23 

3 

0 

2.0 

251.4 

3 

1,900 

1 

12 

2 

1 

2.0 

246.0 

6 

2,300 

1 

7 

3 

1 

3.0 

147.4 

6 

1,700 

0 

12 

1 

0 

2.0 

176.0 

4 

2,200 

1 

15 

1 

1 

2.0 

228.4 

3 

2,300 

1 

17 

5 

1 

1.5 

166.5 

3 

1,600 

0 

19 

3 

0 

2.5 

189.4 

4 

2,200 

1 

24 

1 

1 

2.0 

312.1 

7 

2,400 

1 

13 

3 

1 

3.0 

289.8 

6 

2,000 

1 

21 

3 

1 

3.0 

269.9 

5 

2,200 

0 

11 

4 

1 

2.5 

154.3 

2 

2,000 

1 

13 

2 

0 

2.0 

222.1 

2 

2,100 

1 

9 

5 

1 

2.0 

209.7 

5 

2,200 

0 

13 

2 

1 

2.0 

190.9 

3 

2,200 

0 

18 

3 

1 

2.0 

254.3 

4 

2,500 

0 

15 

3 

1 

2.0 

207.5 

3 

2,100 

0 

10 

2 

0 

2.0 

209.7 

4 

2,200 

0 

19 

2 

1 

2.0 

294.0 

2 

2,100 

1 

13 

2 

1 

2.5 

176.3 

2 

2,000 

0 

17 

3 

0 

2.0 

294.3 

7 

2,400 

1 

8 

4 

1 

2.0 

224.0 

3 

1,900 

0 

6 

1 

1 

2.0 

125.0 

2 

1,900 

1 

18 

4 

0 

1.5 

236.8 

4 

2,600 

0 

17 

5 

1 

2.0 

164.1 

4 

2,300 

1 

19 

4 

0 

2.0 

217.8 

3 

2,500 

1 

12 

3 

0 

2.0 

192.2 

2 

2,400 

1 

16 

2 

0 

2.5 

125.9 

2 

2,400 

1 

28 

1 

0 

1.5 


(continúa) 
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Apéndice A 

A.1 Conjunto de datos 1: Ventas inmobiliarias 
de Goodyear, Arizona ( conclusión ) 


*1 

*2 

* 3 

*4 

*5 

*6 

*7 

*8 

220.9 

2 

2,300 

0 

12 

1 

1 

2.0 

294.5 

6 

2,700 

1 

15 

3 

1 

2.0 

244.6 

2 

2,300 

1 

9 

2 

1 

2.5 

199.0 

3 

2,500 

0 

18 

1 

0 

1.5 

240.0 

4 

2,600 

1 

13 

4 

1 

2.0 

263.2 

4 

2,300 

1 

14 

3 

1 

2.0 

188.1 

2 

1,900 

1 

8 

4 

1 

1.5 

243.7 

6 

2,700 

1 

7 

4 

1 

2.0 

221.5 

4 

2,300 

1 

18 

3 

1 

2.0 

175.0 

2 

2,500 

1 

11 

3 

0 

2.0 

253.2 

3 

2,300 

1 

16 

2 

1 

2.0 

155.4 

4 

2,400 

0 

16 

3 

0 

2.0 

186.7 

5 

2,500 

0 

21 

4 

0 

2.5 

179.0 

3 

2,400 

0 

10 

4 

1 

2.0 

188.3 

6 

2,100 

0 

15 

4 

1 

2.0 

227.1 

4 

2,900 

1 

8 

4 

1 

2.0 

173.6 

4 

2,100 

0 

14 

2 

1 

2.5 

188.3 

5 

2,300 

1 

20 

5 

0 

1.5 

310.8 

8 

2,900 

1 

9 

4 

1 

2.0 

293.7 

6 

2,400 

1 

11 

5 

1 

3.0 

179.0 

3 

2,400 

1 

8 

4 

1 

2.0 

188.3 

6 

2,100 

0 

14 

2 

1 

2.5 

227.1 

4 

2,900 

1 

20 

5 

0 

1.5 

173.6 

4 

2,100 

1 

9 

4 

1 

2.0 

188.3 

5 

2,300 

1 

11 

5 

1 

3.0 
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Apéndice A 

A.2 Conjunto de datos 2: Ligas Mayores de Béisbol, temporada 2009 


Variables 

X-, = Equipo 

x 2 = Liga (Americana = 1 ; Nacional = 0) 

x 3 = Construcción (año en que se construyó el estadio) 

x 4 = Tamaño (capacidad del estadio) 

x 5 = Salario (salario total del equipo en 2009 en millones de dólares) 
x 6 = Victorias 

x 7 = Asistencia (total anual del equipo) 
x 8 = BA (promedio de bateo del equipo) 
x g = ERA (promedio de carreras) 
x 10 = HR (cuadrangulares) 
x u = Errores 
x 12 = SB (bases robadas) 
x 13 = Año 

x 14 = Salario promedio por jugador (en dólares) 
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Apéndice A 

A.3 Conjunto de datos 3: Autobuses del Distrito Escolar Buena 


Variables 

*1 = 
x 2 = 

*3 = 
X 4 = 

*5 = 
*6 = 
X? = 


Número de autobuses 

Costo de mantenimiento (en dólares) 

Edad 

Millas 

Tipo de autobús (diesel o gasolina) 
Fabricante (Bluebird, Keiser, Thompson) 
Pasajeros 


Número de 
autobuses, 

Costo de 
mantenimiento, 

*2 

Años 
de uso, 

*3 

Millas, 

*4 

Tipo de 
autobús, 

*5 

Fabricante, 

*6 

Pasajeros, 

*7 

135 

329 

7 

853 

Diésel 

Bluebird 

55 

120 

503 

10 

883 

Diésel 

Keiser 

42 

200 

505 

10 

822 

Diésel 

Bluebird 

55 

40 

466 

10 

865 

Gasolina 

Bluebird 

55 

427 

359 

7 

751 

Gasolina 

Keiser 

55 

759 

546 

8 

870 

Diésel 

Keiser 

55 

10 

427 

5 

780 

Gasolina 

Keiser 

14 

880 

474 

9 

857 

Gasolina 

Keiser 

55 

481 

382 

3 

818 

Gasolina 

Keiser 

6 

387 

422 

8 

869 

Gasolina 

Bluebird 

55 

326 

433 

9 

848 

Diésel 

Bluebird 

55 

861 

474 

10 

845 

Gasolina 

Bluebird 

55 

122 

558 

10 

885 

Gasolina 

Bluebird 

55 

156 

561 

12 

838 

Diésel 

Thompson 

55 

887 

357 

8 

760 

Diésel 

Bluebird 

6 

686 

329 

3 

741 

Diésel 

Bluebird 

55 

490 

497 

10 

859 

Gasolina 

Bluebird 

55 

370 

459 

8 

826 

Gasolina 

Keiser 

55 

464 

355 

3 

806 

Gasolina 

Bluebird 

55 

875 

489 

9 

858 

Diésel 

Bluebird 

55 

883 

436 

2 

785 

Gasolina 

Bluebird 

55 

57 

455 

7 

828 

Diésel 

Bluebird 

55 

482 

514 

11 

980 

Gasolina 

Bluebird 

55 

704 

503 

8 

857 

Diésel 

Bluebird 

55 

989 

380 

9 

803 

Diésel 

Keiser 

55 

731 

432 

6 

819 

Diésel 

Bluebird 

42 

75 

478 

6 

821 

Diésel 

Bluebird 

55 

162 

406 

3 

798 

Gasolina 

Keiser 

55 

732 

471 

9 

815 

Diésel 

Keiser 

42 

751 

444 

2 

757 

Diésel 

Keiser 

14 

600 

493 

10 

1008 

Diésel 

Bluebird 

55 

948 

452 

9 

831 

Diésel 

Keiser 

42 

358 

461 

6 

849 

Diésel 

Bluebird 

55 

833 

496 

8 

839 

Diésel 

Thompson 

55 

692 

469 

8 

812 

Diésel 

Bluebird 

55 


(continúa) 
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Apéndice A 

A.3 Conjunto de datos 3: Autobuses del Distrito Escolar Buena ( conclusión ) 


Número de 
autobuses, 

*i 

Costo de 
mantenimiento, 

*2 

Años 
de uso, 

*3 

Millas, 

*4 

Tipo de 
autobús, 

*5 

Fabricante, 

*6 

Pasajeros, 

*7 

61 

442 

9 

809 

Diesel 

Keiser 

55 

9 

414 

4 

864 

Gasolina 

Keiser 

55 

314 

459 

11 

859 

Diesel 

Thompson 

6 

396 

457 

2 

815 

Diesel 

Thompson 

55 

365 

462 

6 

799 

Diesel 

Keiser 

55 

398 

570 

9 

844 

Diésel 

Thompson 

14 

43 

439 

9 

832 

Gasolina 

Bluebird 

55 

500 

369 

5 

842 

Gasolina 

Bluebird 

55 

279 

390 

2 

792 

Diésel 

Bluebird 

55 

693 

469 

9 

775 

Gasolina 

Keiser 

55 

884 

381 

9 

882 

Diésel 

Bluebird 

55 

977 

501 

7 

874 

Diésel 

Bluebird 

55 

38 

432 

6 

837 

Gasolina 

Keiser 

14 

725 

392 

5 

774 

Diésel 

Bluebird 

55 

982 

441 

1 

823 

Diésel 

Bluebird 

55 

724 

448 

8 

790 

Diésel 

Keiser 

42 

603 

468 

4 

800 

Diésel 

Keiser 

14 

168 

467 

7 

827 

Gasolina 

Thompson 

55 

45 

478 

6 

830 

Diésel 

Keiser 

55 

754 

515 

14 

895 

Diésel 

Keiser 

14 

39 

411 

6 

804 

Gasolina 

Bluebird 

55 

671 

504 

8 

866 

Gasolina 

Thompson 

55 

418 

504 

9 

842 

Diésel 

Bluebird 

55 

984 

392 

8 

851 

Diésel 

Bluebird 

55 

953 

423 

10 

835 

Diésel 

Bluebird 

55 

507 

410 

7 

866 

Diésel 

Bluebird 

55 

540 

529 

4 

846 

Gasolina 

Bluebird 

55 

695 

477 

2 

802 

Diésel 

Bluebird 

55 

193 

540 

11 

847 

Diésel 

Thompson 

55 

321 

450 

6 

856 

Diésel 

Bluebird 

6 

918 

390 

5 

799 

Diésel 

Bluebird 

55 

101 

424 

4 

827 

Désel 

Bluebird 

55 

714 

433 

7 

817 

Diésel 

Bluebird 

42 

678 

428 

7 

842 

Diésel 

Keiser 

55 

768 

494 

7 

815 

Diésel 

Bluebird 

42 

29 

396 

6 

784 

Gasolina 

Bluebird 

55 

554 

458 

4 

817 

Diésel 

Bluebird 

14 

767 

493 

6 

816 

Diésel 

Keiser 

55 

699 

475 

9 

816 

Gasolina 

Bluebird 

55 

954 

476 

10 

827 

Diésel 

Bluebird 

42 

705 

403 

4 

806 

Diésel 

Keiser 

42 

660 

337 

6 

819 

Gasolina 

Bluebird 

55 

520 

492 

10 

836 

Diésel 

Bluebird 

55 

814 

426 

4 

757 

Diésel 

Bluebird 

55 

353 

449 

4 

817 

Gasolina 

Keiser 

55 
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Apéndice A 

A.4 Conjunto de datos 4: Applewood Auto Group 


Variables 

x 1 = Edad: edad del comprador al tiempo de la adquisición 
x 2 = Ganancia: la cantidad obtenida por el distribuidor sobre la venta de cada 
vehículo 

x 3 = Locación: distribuidora donde fue comprado el vehículo 
x 4 = Tipo de vehículo: SUV, sedán, compacto, híbrido o camión 
x 5 = Previo: número de vehículos comprados por el cliente previamente en 
cualquiera de las cuatro distribuidoras de Applewood 


Edad 

Ganancia 

Locación 

Tipo de vehículo 

Previo 

Edad 

Ganancia 

Locación 

Tipo de vehículo 

Previo 

Xl 

x 2 

*3 

x 4 

*5 

*i 

x 2 

*3 

x 4 

*5 

21 

$1,387 

Honesta 

Sedan 

0 

40 

$1,485 

Sheffield 

Compact 

0 

23 

1,754 

Sheffield 

SUV 

1 

40 

1,509 

Kane 

SUV 

2 

24 

1,817 

Sheffield 

Hybrld 

1 

40 

1,638 

Sheffield 

Sedan 

0 

25 

1,040 

Sheffield 

Compact 

0 

40 

1,961 

Sheffield 

Sedan 

1 

26 

1,273 

Kane 

Sedan 

1 

40 

2,127 

Olean 

Truck 

0 

27 

1,529 

Sheffield 

Sedan 

1 

40 

2,430 

Tionesta 

Sedan 

1 

27 

3,082 

Kane 

Truck 

0 

41 

1,704 

Sheffield 

Sedan 

1 

28 

1,951 

Kane 

SUV 

1 

41 

1,876 

Kane 

Sedan 

2 

28 

2,692 

Honesta 

Compact 

0 

41 

2,010 

Tionesta 

Sedan 

1 

29 

1,206 

Sheffield 

Sedan 

0 

41 

2,165 

Tionesta 

SUV 

0 

29 

1,342 

Kane 

Sedan 

2 

41 

2,231 

Tionesta 

SUV 

2 

30 

443 

Kane 

Sedan 

3 

41 

2,389 

Kane 

Truck 

1 

30 

754 

Olean 

Sedan 

2 

42 

335 

Olean 

SUV 

1 

30 

1,621 

Sheffield 

Truck 

1 

42 

963 

Kane 

Sedan 

0 

31 

870 

Honesta 

Sedan 

1 

42 

1,298 

Tionesta 

Sedan 

1 

31 

1,174 

Kane 

Truck 

0 

42 

1,410 

Kane 

SUV 

2 

31 

1,412 

Sheffield 

Sedan 

1 

42 

1,553 

Tionesta 

Compact 

0 

31 

1,809 

Honesta 

Sedan 

1 

42 

1,648 

Olean 

SUV 

0 

31 

2,415 

Kane 

Sedan 

0 

42 

2,071 

Kane 

SUV 

0 

32 

1,546 

Sheffield 

Truck 

3 

42 

2,116 

Kane 

Compact 

2 

32 

2,148 

Honesta 

SUV 

2 

43 

1,500 

Tionesta 

Sedan 

0 

32 

2,207 

Sheffield 

Compact 

0 

43 

1,549 

Kane 

SUV 

2 

32 

2,252 

Honesta 

SUV 

0 

43 

2,348 

Tionesta 

Sedan 

0 

33 

1,428 

Kane 

SUV 

2 

43 

2,498 

Tionesta 

SUV 

1 

33 

1,889 

Olean 

SUV 

1 

44 

294 

Kane 

SUV 

1 

34 

1,166 

Olean 

Sedan 

1 

44 

1,115 

Kane 

Truck 

0 

34 

1,320 

Honesta 

Sedan 

1 

44 

1,124 

Tionesta 

Compact 

2 

34 

2,265 

Olean 

Sedan 

0 

44 

1,532 

Tionesta 

SUV 

3 

35 

1,323 

Olean 

Sedan 

2 

44 

1,688 

Kane 

Sedan 

4 

35 

1,761 

Kane 

Sedan 

1 

44 

1,822 

Kane 

SUV 

0 

35 

1,919 

Honesta 

SUV 

1 

44 

1,897 

Sheffield 

Compact 

0 

36 

2,357 

Kane 

SUV 

2 

44 

2,445 

Kane 

SUV 

0 

36 

2,866 

Kane 

Sedan 

1 

44 

2,886 

Olean 

SUV 

1 

37 

732 

Olean 

SUV 

1 

45 

820 

Kane 

Compact 

1 

37 

1,464 

Olean 

Sedan 

3 

45 

1,266 

Olean 

Sedan 

0 

37 

1,626 

Tionesta 

Compact 

4 

45 

1,741 

Olean 

Compact 

2 

37 

1,761 

Olean 

SUV 

1 

45 

1,772 

Olean 

Compact 

1 

37 

1,915 

Tionesta 

SUV 

2 

45 

1,932 

Tionesta 

Sedan 

1 

37 

2,119 

Kane 

Hybrid 

1 

45 

2,350 

Sheffield 

Compact 

0 

38 

1,766 

Sheffield 

SUV 

0 

45 

2,422 

Kane 

Sedan 

1 

38 

2,201 

Sheffield 

Truck 

2 

45 

2,446 

Olean 

Compact 

1 

39 

996 

Kane 

Compact 

2 

46 

369 

Olean 

Sedan 

1 

39 

2,813 

Honesta 

SUV 

0 

46 

978 

Kane 

Sedan 

1 

40 

323 

Kane 

Sedan 

0 

46 

1,238 

Sheffield 

Compact 

1 

40 

352 

Sheffield 

Compact 

0 

46 

1,818 

Kane 

SUV 

0 

40 

482 

Olean 

Sedan 

1 

46 

1,824 

Olean 

Truck 

0 

40 

1,144 

Tionesta 

Truck 

0 

46 

1,907 

Olean 

Sedan 

0 


(continúa) 
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Apéndice A 

A.4 Conjunto de datos 4: Applewood Auto Group (conclusión) 


Edad 

*i 

Ganancia 

*2 

Locación 

*3 

Tipo de vehiculo 

X 4 

Previo 

*5 

Edad 

*i 

Ganancia 

*2 

Locación 

*3 

Tipo de vehiculo 

*4 

Previo 

*5 

46 

$1,938 

Kane 

Sedan 

0 

53 

$1,401 

Tionesta 

SUV 

2 

46 

1,940 

Kane 

Truck 

3 

53 

2,175 

Olean 

Sedan 

1 

46 

2,197 

Sheffield 

Sedan 

1 

54 

1,118 

Sheffield 

Compact 

1 

46 

2,646 

Tionesta 

Sedan 

2 

54 

2,584 

Olean 

Compact 

2 

47 

1,461 

Kane 

Sedan 

0 

54 

2,666 

Tionesta 

Truck 

0 

47 

1,731 

Tionesta 

Compact 

0 

54 

2,991 

Tionesta 

SUV 

0 

47 

2,230 

Tionesta 

Sedan 

1 

55 

934 

Sheffield 

Truck 

1 

47 

2,341 

Sheffield 

SUV 

1 

55 

2,063 

Kane 

SUV 

1 

47 

3,292 

Olean 

Sedan 

2 

55 

2,083 

Sheffield 

Sedan 

1 

48 

1,108 

Sheffield 

Sedan 

1 

55 

2,856 

Olean 

Hybrid 

1 

48 

1,295 

Sheffield 

SUV 

1 

55 

2,989 

Tionesta 

Compact 

1 

48 

1,344 

Sheffield 

SUV 

0 

56 

910 

Sheffield 

SUV 

0 

48 

1,906 

Kane 

Sedan 

1 

56 

1,536 

Kane 

SUV 

0 

48 

1,952 

Tionesta 

Compact 

1 

56 

1,957 

Sheffield 

SUV 

1 

48 

2,070 

Kane 

SUV 

1 

56 

2,240 

Olean 

Sedan 

0 

48 

2,454 

Kane 

Sedan 

1 

56 

2,695 

Kane 

Sedan 

2 

49 

1,606 

Olean 

Compact 

0 

57 

1,325 

Olean 

Sedan 

1 

49 

1,680 

Kane 

SUV 

3 

57 

2,250 

Sheffield 

Sedan 

2 

49 

1,827 

Tionesta 

Truck 

3 

57 

2,279 

Sheffield 

Hybrid 

1 

49 

1,915 

Tionesta 

SUV 

1 

57 

2,626 

Sheffield 

Sedan 

2 

49 

2,084 

Tionesta 

Sedan 

0 

58 

1,501 

Sheffield 

Hybrid 

1 

49 

2,639 

Sheffield 

SUV 

0 

58 

1,752 

Kane 

Sedan 

3 

50 

842 

Kane 

SUV 

0 

58 

2,058 

Kane 

SUV 

1 

50 

1,963 

Sheffield 

Sedan 

1 

58 

2,370 

Tionesta 

Compact 

0 

50 

2,059 

Sheffield 

Sedan 

1 

58 

2,637 

Sheffield 

SUV 

1 

50 

2,338 

Tionesta 

SUV 

0 

59 

1,426 

Sheffield 

Sedan 

0 

50 

3,043 

Kane 

Sedan 

0 

59 

2,944 

Olean 

SUV 

2 

51 

1,059 

Kane 

SUV 

1 

60 

2,147 

Olean 

Compact 

2 

51 

1,674 

Sheffield 

Sedan 

1 

61 

1,973 

Kane 

SUV 

3 

51 

1,807 

Tionesta 

Sedan 

1 

61 

2,502 

Olean 

Sedan 

0 

51 

2,056 

Sheffield 

Hybrid 

0 

62 

783 

Sheffield 

Hybrid 

1 

51 

2,236 

Tionesta 

SUV 

2 

62 

1,538 

Olean 

Truck 

1 

51 

2,928 

Kane 

SUV 

0 

63 

2,339 

Olean 

Compact 

1 

52 

1,269 

Tionesta 

Sedan 

1 

64 

2,700 

Kane 

Truck 

0 

52 

1,717 

Sheffield 

SUV 

3 

65 

2,222 

Kane 

Truck 

1 

52 

1,797 

Kane 

Sedan 

1 

65 

2,597 

Sheffield 

Truck 

0 

52 

1,955 

Olean 

Hybrid 

2 

65 

2,742 

Tionesta 

SUV 

2 

52 

2,199 

Tionesta 

SUV 

0 

68 

1,837 

Sheffield 

Sedan 

1 

52 

2,482 

Olean 

Compact 

0 

69 

2,842 

Kane 

SUV 

0 

52 

2,701 

Sheffield 

SUV 

0 

70 

2,434 

Olean 

Sedan 

4 

52 

3,210 

Olean 

Truck 

4 

72 

1,640 

Olean 

Sedan 

1 

53 

377 

Olean 

SUV 

1 

72 

1,821 

Tionesta 

SUV 

1 

53 

1,220 

Olean 

Sedan 

0 

73 

2,487 

Olean 

Compact 

4 


780 


Apéndice A 

A.5 Conjunto de datos bancarios: caso del Century National Bank 

(secciones de repaso) 


Variables 

x 1 = Saldo en cuenta 

x 2 = Número de operaciones en cajero automático en el mes 

x 3 = Número de otros servicios bancarios utilizados 

x 4 = Tiene tarjeta de débito (1 = sí, 0 = no) 

x 5 = Recibe intereses sobre la cuenta (1 = sí, 0 = no) 

x 6 = Ciudad donde se abrió la cuenta 

60 cuentas 


Xi 

*2 

*3 

*4 

*5 

*6 

Xl 

*2 

*3 

*4 

*5 

*6 

1,756 

13 

4 

0 

1 

2 

1,958 

6 

2 

1 

0 

2 

748 

9 

2 

1 

0 

1 

634 

2 

7 

1 

0 

4 

1,501 

10 

1 

0 

0 

1 

580 

4 

1 

0 

0 

1 

1,831 

10 

4 

0 

1 

3 

1,320 

4 

5 

1 

0 

1 

1,622 

14 

6 

0 

1 

4 

1,675 

6 

7 

1 

0 

2 

1,886 

17 

3 

0 

1 

1 

789 

8 

4 

0 

0 

4 

740 

6 

3 

0 

0 

3 

1,735 

12 

7 

0 

1 

3 

1,593 

10 

8 

1 

0 

1 

1,784 

11 

5 

0 

0 

1 

1,169 

6 

4 

0 

0 

4 

1,326 

16 

8 

0 

0 

3 

2,125 

18 

6 

0 

0 

2 

2,051 

14 

4 

1 

0 

4 

1,554 

12 

6 

1 

0 

3 

1,044 

7 

5 

1 

0 

1 

1,474 

12 

7 

1 

0 

1 

1,885 

10 

6 

1 

1 

2 

1,913 

6 

5 

0 

0 

1 

1,790 

11 

4 

0 

1 

3 

1,218 

10 

3 

1 

0 

1 

765 

4 

3 

0 

0 

4 

1,006 

12 

4 

0 

0 

1 

1,645 

6 

9 

0 

1 

4 

2,215 

20 

3 

1 

0 

4 

32 

2 

0 

0 

0 

3 

137 

7 

2 

0 

0 

3 

1,266 

11 

7 

0 

0 

4 

167 

5 

4 

0 

0 

4 

890 

7 

1 

0 

1 

1 

343 

7 

2 

0 

0 

1 

2,204 

14 

5 

0 

0 

2 

2,557 

20 

7 

1 

0 

4 

2,409 

16 

8 

0 

0 

2 

2,276 

15 

4 

1 

0 

3 

1,338 

14 

4 

1 

0 

2 

1,494 

11 

2 

0 

1 

1 

2,076 

12 

5 

1 

0 

2 

2,144 

17 

3 

0 

0 

3 

1,708 

13 

3 

1 

0 

1 

1,995 

10 

7 

0 

0 

2 

2,138 

18 

5 

0 

1 

4 

1,053 

8 

4 

1 

0 

3 

2,375 

12 

4 

0 

0 

2 

1,526 

8 

4 

0 

1 

2 

1,455 

9 

5 

1 

1 

3 

1,120 

8 

6 

1 

0 

3 

1,487 

8 

4 

1 

0 

4 

1,838 

7 

5 

1 

1 

3 

1,125 

6 

4 

1 

0 

2 

1,746 

11 

2 

0 

0 

2 

1,989 

12 

3 

0 

1 

2 

1,616 

10 

4 

1 

1 

2 

2,156 

14 

5 

1 

0 

2 
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Apéndice B: Tablas 

B.1 Áreas bajo la curva normal 


Ejemplo: 

Si z= 1.96, entonces 
P ( 0 a z) = 0.4750. 



z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.0000 

0.0040 

0.0080 

0.0120 

0.0160 

0.0199 

0.0239 

0.0279 

0.0319 

0.0359 

0.1 

0.0398 

0.0438 

0.0478 

0.0517 

0.0557 

0.0596 

0.0636 

0.0675 

0.0714 

0.0753 

0.2 

0.0793 

0.0832 

0.0871 

0.0910 

0.0948 

0.0987 

0.1026 

0.1064 

0.1103 

0.1141 

0.3 

0.1179 

0.1217 

0.1255 

0.1293 

0.1331 

0.1368 

0.1406 

0.1443 

0.1480 

0.1517 

0.4 

0.1554 

0.1591 

0.1628 

0.1664 

0.1700 

0.1736 

0.1772 

0.1808 

0.1844 

0.1879 

0.5 

0.1915 

0.1950 

0.1985 

0.2019 

0.2054 

0.2088 

0.2123 

0.2157 

0.2190 

0.2224 

0.6 

0.2257 

0.2291 

0.2324 

0.2357 

0.2389 

0.2422 

0.2454 

0.2486 

0.2517 

0.2549 

0.7 

0.2580 

0.2611 

0.2642 

0.2673 

0.2704 

0.2734 

0.2764 

0.2794 

0.2823 

0.2852 

0.8 

0.2881 

0.2910 

0.2939 

0.2967 

0.2995 

0.3023 

0.3051 

0.3078 

0.3106 

0.3133 

0.9 

0.3159 

0.3186 

0.3212 

0.3238 

0.3264 

0.3289 

0.3315 

0.3340 

0.3365 

0.3389 

1.0 

0.3413 

0.3438 

0.3461 

0.3485 

0.3508 

0.3531 

0.3554 

0.3577 

0.3599 

0.3621 

1.1 

0.3643 

0.3665 

0.3686 

0.3708 

0.3729 

0.3749 

0.3770 

0.3790 

0.3810 

0.3830 

1.2 

0.3849 

0.3869 

0.3888 

0.3907 

0.3925 

0.3944 

0.3962 

0.3980 

0.3997 

0.4015 

1.3 

0.4032 

0.4049 

0.4066 

0.4082 

0.4099 

0.4115 

0.4131 

0.4147 

0.4162 

0.4177 

1.4 

0.4192 

0.4207 

0.4222 

0.4236 

0.4251 

0.4265 

0.4279 

0.4292 

0.4306 

0.4319 

1.5 

0.4332 

0.4345 

0.4357 

0.4370 

0.4382 

0.4394 

0.4406 

0.4418 

0.4429 

0.4441 

1.6 

0.4452 

0.4463 

0.4474 

0.4484 

0.4495 

0.4505 

0.4515 

0.4525 

0.4535 

0.4545 

1.7 

0.4554 

0.4564 

0.4573 

0.4582 

0.4591 

0.4599 

0.4608 

0.4616 

0.4625 

0.4633 

1.8 

0.4641 

0.4649 

0.4656 

0.4664 

0.4671 

0.4678 

0.4686 

0.4693 

0.4699 

0.4706 

1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 

0.4750 

0.4756 

0.4761 

0.4767 

2.0 

0.4772 

0.4778 

0.4783 

0.4788 

0.4793 

0.4798 

0.4803 

0.4808 

0.4812 

0.4817 

2.1 

0.4821 

0.4826 

0.4830 

0.4834 

0.4838 

0.4842 

0.4846 

0.4850 

0.4854 

0.4857 

2.2 

0.4861 

0.4864 

0.4868 

0.4871 

0.4875 

0.4878 

0.4881 

0.4884 

0.4887 

0.4890 

2.3 

0.4893 

0.4896 

0.4898 

0.4901 

0.4904 

0.4906 

0.4909 

0.4911 

0.4913 

0.4916 

2.4 

0.4918 

0.4920 

0.4922 

0.4925 

0.4927 

0.4929 

0.4931 

0.4932 

0.4934 

0.4936 

2.5 

0.4938 

0.4940 

0.4941 

0.4943 

0.4945 

0.4946 

0.4948 

0.4949 

0.4951 

0.4952 

2.6 

0.4953 

0.4955 

0.4956 

0.4957 

0.4959 

0.4960 

0.4961 

0.4962 

0.4963 

0.4964 

2.7 

0.4965 

0.4966 

0.4967 

0.4968 

0.4969 

0.4970 

0.4971 

0.4972 

0.4973 

0.4974 

2.8 

0.4974 

0.4975 

0.4976 

0.4977 

0.4977 

0.4978 

0.4979 

0.4979 

0.4980 

0.4981 

2.9 

0.4981 

0.4982 

0.4982 

0.4983 

0.4984 

0.4984 

0.4985 

0.4985 

0.4986 

0.4986 

3.0 

0.4987 

0.4987 

0.4987 

0.4988 

0.4988 

0.4989 

0.4989 

0.4989 

0.4990 

0.4990 
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Apéndice B 

B.2 Distribución t de Student 


á 

~t t 

Intervalo de confianza 



Intervalo de confianza, c Intervalo de confianza, c 



80% 

90% 

95% 

98% 

99% 

99.9% 


80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia de una prueba de una cola, a 


Nivel de significancia de una prueba de una cola, a 

91 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 

9 l 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia de una prueba de dos colas, a 


Nivel de significancia de una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

636.619 

36 

1.306 

1.688 

2.028 

2.434 

2.719 

3.582 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

31.599 

37 

1.305 

1.687 

2.026 

2.431 

2.715 

3.574 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

12.924 

38 

1.304 

1.686 

2.024 

2.429 

2.712 

3.566 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

8.610 

39 

1.304 

1.685 

2.023 

2.426 

2.708 

3.558 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

6.869 

40 

1.303 

1.684 

2.021 

2.423 

2.704 

3.551 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

5.959 

41 

1.303 

1.683 

2.020 

2.421 

2.701 

3.544 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

5.408 

42 

1.302 

1.682 

2.018 

2.418 

2.698 

3.538 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

5.041 

43 

1.302 

1.681 

2.017 

2.416 

2.695 

3.532 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.781 

44 

1.301 

1.680 

2.015 

2.414 

2.692 

3.526 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.587 

45 

1.301 

1.679 

2.014 

2.412 

2.690 

3.520 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

4.437 

46 

1.300 

1.679 

2.013 

2.410 

2.687 

3.515 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

4.318 

47 

1.300 

1.678 

2.012 

2.408 

2.685 

3.510 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

4.221 

48 

1.299 

1.677 

2.011 

2.407 

2.682 

3.505 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

4.140 

49 

1.299 

1.677 

2.010 

2.405 

2.680 

3.500 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

4.073 

50 

1.299 

1.676 

2.009 

2.403 

2.678 

3.496 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

4.015 

51 

1.298 

1.675 

2.008 

2.402 

2.676 

3.492 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

3.965 

52 

1.298 

1.675 

2.007 

2.400 

2.674 

3.488 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

3.922 

53 

1.298 

1.674 

2.006 

2.399 

2.672 

3.484 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

3.883 

54 

1.297 

1.674 

2.005 

2.397 

2.670 

3.480 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

3.850 

55 

1.297 

1.673 

2.004 

2.396 

2.668 

3.476 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

3.819 

56 

1.297 

1.673 

2.003 

2.395 

2.667 

3.473 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

3.792 

57 

1.297 

1.672 

2.002 

2.394 

2.665 

3.470 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

3.768 

58 

1.296 

1.672 

2.002 

2.392 

2.663 

3.466 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

3.745 

59 

1.296 

1.671 

2.001 

2.391 

2.662 

3.463 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

3.725 

60 

1.296 

1.671 

2.000 

2.390 

2.660 

3.460 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

3.707 

61 

1.296 

1.670 

2.000 

2.389 

2.659 

3.457 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

3.690 

62 

1.295 

1.670 

1.999 

2.388 

2.657 

3.454 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

3.674 

63 

1.295 

1.669 

1.998 

2.387 

2.656 

3.452 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

3.659 

64 

1.295 

1.669 

1.998 

2.386 

2.655 

3.449 

30 

1.310 

1.697 

2.042 

2.457 

2.750 

3.646 

65 

1.295 

1.669 

1.997 

2.385 

2.654 

3.447 

31 

1.309 

1.696 

2.040 

2.453 

2.744 

3.633 

66 

1.295 

1.668 

1.997 

2.384 

2.652 

3.444 

32 

1.309 

1.694 

2.037 

2.449 

2.738 

3.622 

67 

1.294 

1.668 

1.996 

2.383 

2.651 

3.442 

33 

1.308 

1.692 

2.035 

2.445 

2.733 

3.611 

68 

1.294 

1.668 

1.995 

2.382 

2.650 

3.439 

34 

1.307 

1.691 

2.032 

2.441 

2.728 

3.601 

69 

1.294 

1.667 

1.995 

2.382 

2.649 

3.437 

35 

1.306 

1.690 

2.030 

2.438 

2.724 

3.591 

70 

1.294 

1.667 

1.994 

2.381 

2.648 

3.435 


(i continúa ) 
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Apéndice B 

B.2 Distribución t de Student ( conclusión ) 


Intervalo de confianza, c Intervalo de confianza, c 



80% 

90% 

95% 

98% 

99% 

99.9% 

80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia de una prueba de una cola, a 

Nivel de significancia de una prueba de una cola, a 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 gl 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia de la prueba de dos colas, a 

Nivel de significancia de la prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

71 

1.294 

1.667 

1.994 

2.380 

2.647 

3.433 89 

1.291 

1.662 

1.987 

2.369 

2.632 

3.403 

72 

1.293 

1.666 

1.993 

2.379 

2.646 

3.431 90 

1.291 

1.662 

1.987 

2.368 

2.632 

3.402 

73 

1.293 

1.666 

1.993 

2.379 

2.645 

3.429 







74 

1.293 

1.666 

1.993 

2.378 

2.644 

3.427 91 

1.291 

1.662 

1.986 

2.368 

2.631 

3.401 

75 

1.293 

1.665 

1.992 

2.377 

2.643 

3.425 92 

1.291 

1.662 

1.986 

2.368 

2.630 

3.399 







93 

1.291 

1.661 

1.986 

2.367 

2.630 

3.398 

76 

1.293 

1.665 

1.992 

2.376 

2.642 

3.423 94 

1.291 

1.661 

1.986 

2.367 

2.629 

3.397 

77 

1.293 

1.665 

1.991 

2.376 

2.641 

3.421 95 

1.291 

1.661 

1.985 

2.366 

2.629 

3.396 

78 

1.292 

1.665 

1.991 

2.375 

2.640 

3.420 







79 

1.292 

1.664 

1.990 

2.374 

2.640 

3.418 96 

1.290 

1.661 

1.985 

2.366 

2.628 

3.395 

80 

1.292 

1.664 

1.990 

2.374 

2.639 

3.416 97 

1.290 

1.661 

1.985 

2.365 

2.627 

3.394 







98 

1.290 

1.661 

1.984 

2.365 

2.627 

3.393 

81 

1.292 

1.664 

1.990 

2.373 

2.638 

3.415 99 

1.290 

1.660 

1.984 

2.365 

2.626 

3.392 

82 

1.292 

1.664 

1.989 

2.373 

2.637 

3.413 100 

1.290 

1.660 

1.984 

2.364 

2.626 

3.390 

83 

1.292 

1.663 

1.989 

2.372 

2.636 

3.412 







84 

1.292 

1.663 

1.989 

2.372 

2.636 

3.410 120 

1.289 

1.658 

1.980 

2.358 

2.617 

3.373 

85 

1.292 

1.663 

1.988 

2.371 

2.635 

3.409 140 

1.288 

1.656 

1.977 

2.353 

2.611 

3.361 







160 

1.287 

1.654 

1.975 

2.350 

2.607 

3.352 

86 

1.291 

1.663 

1.988 

2.370 

2.634 

3.407 180 

1.286 

1.653 

1.973 

2.347 

2.603 

3.345 

87 

1.291 

1.663 

1.988 

2.370 

2.634 

3.406 200 

1.286 

1.653 

1.972 

2.345 

2.601 

3.340 

88 

1.291 

1.662 

1.987 

2.369 

2.633 

3.405 oo 

1.282 

1.645 

1.960 

2.326 

2.576 

3.291 
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Apéndice B 

B.3 Valores críticos de j¡ cuadrada 


Esta tabla contiene los valores de x 2 correspondientes a un área específica de la 
cola derecha y un número específico de grados de libertad. 



Ejemplo: con 17 
gl y un área de 0.02 
en la cola superior, 
X 2 = 30.995 


Grados de 
libertad, 

gi 

Area de la cola derecha 

0.10 

0.05 

0.02 

0.01 

1 

2.706 

3.841 

5.412 

6.635 

2 

4.605 

5.991 

7.824 

9.210 

3 

6.251 

7.815 

9.837 

11.345 

4 

7.779 

9.488 

1 1 .668 

13.277 

5 

9.236 

11.070 

13.388 

15.086 

6 

10.645 

12.592 

15.033 

16.812 

7 

12.017 

14.067 

16.622 

18.475 

8 

13.362 

15.507 

18.168 

20.090 

9 

14.684 

16.919 

19.679 

21.666 

10 

15.987 

18.307 

21.161 

23.209 

11 

17.275 

19.675 

22.618 

24.725 

12 

18.549 

21.026 

24.054 

26.217 

13 

19.812 

22.362 

25.472 

27.688 

14 

21.064 

23.685 

26.873 

29.141 

15 

22.307 

24.996 

28.259 

30.578 

16 

23.542 

26.296 

29.633 

32.000 

17 

24.769 

27.587 

30.995 

33.409 

18 

25.989 

28.869 

32.346 

34.805 

19 

27.204 

30.144 

33.687 

36.191 

20 

28.412 

31.410 

35.020 

37.566 

21 

29.615 

32.671 

36.343 

38.932 

22 

30.813 

33.924 

37.659 

40.289 

23 

32.007 

35.172 

38.968 

41.638 

24 

33.196 

36.415 

40.270 

42.980 

25 

34.382 

37.652 

41.566 

44.314 

26 

35.563 

38.885 

42.856 

45.642 

27 

36.741 

40.113 

44.140 

46.963 

28 

37.916 

41.337 

45.419 

48.278 

29 

39.087 

42.557 

46.693 

49.588 

30 

40.256 

43.773 

47.962 

50.892 
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Apéndice B 

B.4 Valores críticos de la distribución F 
en un nivel de significancia de 5% 



Grados de libertad en el numerador 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

12 

15 

20 

24 

30 

40 

1 

161 

200 

216 

225 

230 

234 

237 

239 

241 

242 

244 

246 

248 

249 

250 

251 

2 

18.5 

19.0 

19.2 

19.2 

19.3 

19.3 

19.4 

19.4 

19.4 

19.4 

19.4 

19.4 

19.4 

19.5 

19.5 

19.5 

3 

10.1 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

8.79 

8.74 

8.70 

8.66 

8.64 

8.62 

8.59 

4 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

4.74 

4.68 

4.62 

4.56 

4.53 

4.50 

4.46 

6 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

4.06 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

7 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

3.64 

3.57 

3.51 

3.44 

3.41 

3.38 

3.34 

8 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

3.35 

3.28 

3.22 

3.15 

3.12 

3.08 

3.04 

9 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

3.14 

3.07 

3.01 

2.94 

2.90 

2.86 

2.83 

10 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

2.98 

2.91 

2.85 

2.77 

2.74 

2.70 

2.66 

11 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

2.85 

2.79 

2.72 

2.65 

2.61 

2.57 

2.53 

12 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

2.75 

2.69 

2.62 

2.54 

2.51 

2.47 

2.43 

13 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 

2.67 

2.60 

2.53 

2.46 

2.42 

2.38 

2.34 

14 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

2.60 

2.53 

2.46 

2.39 

2.35 

2.31 

2.27 

15 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

2.54 

2.48 

2.40 

2.33 

2.29 

2.25 

2.20 

16 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

2.49 

2.42 

2.35 

2.28 

2.24 

2.19 

2.15 

17 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 

2.45 

2.38 

2.31 

2.23 

2.19 

2.15 

2.10 

18 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

2.41 

2.34 

2.27 

2.19 

2.15 

2.11 

2.06 

19 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

20 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

2.35 

2.28 

2.20 

2.12 

2.08 

2.04 

1.99 

21 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

22 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

2.30 

2.23 

2.15 

2.07 

2.03 

1.98 

1.94 

23 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 

2.27 

2.20 

2.13 

2.05 

2.01 

1.96 

1.91 

24 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

2.25 

2.18 

2.11 

2.03 

1.98 

1.94 

1.89 

25 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

30 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

2.16 

2.09 

2.01 

1.93 

1.89 

1.84 

1.79 

40 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

2.08 

2.00 

1.92 

1.84 

1.79 

1.74 

1.69 

60 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

1.99 

1.92 

1.84 

1.75 

1.70 

1.65 

1.59 

120 

3.92 

3.07 

2.68 

2.45 

2.29 

2.18 

2.09 

2.02 

1.96 

1.91 

1.83 

1.75 

1.66 

1.61 

1.55 

1.50 

00 

3.84 

3.00 

2.60 

2.37 

2.21 

2.10 

2.01 

1.94 

1.88 

1.83 

1.75 

1.67 

1.57 

1.52 

1.46 

1.39 
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Apéndice B 

B.4 Valores críticos de la distribución Fen 
un nivel de significancia de 5% (conclusión) 



Grados de libertad en el numerador 



1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

12 

15 

20 

24 

30 

40 

1 

4052 

5000 

5403 

5625 

5764 

5859 

5928 

5981 

6022 

6056 

6106 

6157 

6209 

6235 

6261 

6287 

2 

98.5 

99.0 

99.2 

99.2 

99.3 

99.3 

99.4 

99.4 

99.4 

99.4 

99.4 

99.4 

99.4 

99.5 

99.5 

99.5 

3 

34.1 

30.8 

29.5 

28.7 

28.2 

27.9 

27.7 

27.5 

27.3 

27.2 

27.1 

26.9 

26.7 

26.6 

26.5 

26.4 

4 

21.2 

18.0 

16.7 

16.0 

15.5 

15.2 

15.0 

14.8 

14.7 

14.5 

14.4 

14.2 

14.0 

13.9 

13.8 

13.7 

5 

16.3 

13.3 

12.1 

11.4 

11.0 

10.7 

10.5 

10.3 

10.2 

10.1 

9.89 

9.72 

9.55 

9.47 

9.38 

9.29 

6 

13.7 

10.9 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

7.87 

7.72 

7.56 

7.40 

7.31 

7.23 

7.14 

7 

12.2 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

6.62 

6.47 

6.31 

6.16 

6.07 

5.99 

5.91 

8 

11.3 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

5.81 

5.67 

5.52 

5.36 

5.28 

5.20 

5.12 

9 

10.6 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

5.26 

5.11 

4.96 

4.81 

4.73 

4.65 

4.57 

10 

10.0 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

4.85 

4.71 

4.56 

4.41 

4.33 

4.25 

4.17 

11 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

4.54 

4.40 

4.25 

4.10 

4.02 

3.94 

3.86 

12 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

4.30 

4.16 

4.01 

3.86 

3.78 

3.70 

3.62 

13 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

4.10 

3.96 

3.82 

3.66 

3.59 

3.51 

3.43 

14 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 

3.94 

3.80 

3.66 

3.51 

3.43 

3.35 

3.27 

15 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

3.80 

3.67 

3.52 

3.37 

3.29 

3.21 

3.13 

16 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

3.69 

3.55 

3.41 

3.26 

3.18 

3.10 

3.02 

17 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

3.59 

3.46 

3.31 

3.16 

3.08 

3.00 

2.92 

18 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

3.51 

3.37 

3.23 

3.08 

3.00 

2.92 

2.84 

19 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 

3.43 

3.30 

3.15 

3.00 

2.92 

2.84 

2.76 

20 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

3.37 

3.23 

3.09 

2.94 

2.86 

2.78 

2.69 

21 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 

3.31 

3.17 

3.03 

2.88 

2.80 

2.72 

2.64 

22 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

3.26 

3.12 

2.98 

2.83 

2.75 

2.67 

2.58 

23 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 

3.21 

3.07 

2.93 

2.78 

2.70 

2.62 

2.54 

24 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

3.17 

3.03 

2.89 

2.74 

2.66 

2.58 

2.49 

25 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 

3.13 

2.99 

2.85 

2.70 

2.62 

2.54 

2.45 

30 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

2.98 

2.84 

2.70 

2.55 

2.47 

2.39 

2.30 

40 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

2.80 

2.66 

2.52 

2.37 

2.29 

2.20 

2.11 

60 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

2.63 

2.50 

2.35 

2.20 

2.12 

2.03 

1.94 

120 

6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 

2.47 

2.34 

2.19 

2.03 

1.95 

1.86 

1.76 

00 

6.63 

4.61 

3.78 

3.32 

3.02 

2.80 

2.64 

2.51 

2.41 

2.32 

2.18 

2.04 

1.88 

1.79 

1.70 

1.59 
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B.5 Distribución de Poisson 




X 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

0.7 

0.8 

0.9 

0 

0.9048 

0.8187 

0.7408 

0.6703 

0.6065 

0.5488 

0.4966 

0.4493 

0.4066 

i 

0.0905 

0.1637 

0.2222 

0.2681 

0.3033 

0.3293 

0.3476 

0.3595 

0.3659 

2 

0.0045 

0.0164 

0.0333 

0.0536 

0.0758 

0.0988 

0.1217 

0.1438 

0.1647 

3 

0.0002 

0.0011 

0.0033 

0.0072 

0.0126 

0.0198 

0.0284 

0.0383 

0.0494 

4 

0.0000 

0.0001 

0.0003 

0.0007 

0.0016 

0.0030 

0.0050 

0.0077 

0.0111 

5 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0004 

0.0007 

0.0012 

0.0020 

6 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0002 

0.0003 

7 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 




X 

1.0 

2.0 

3.0 

4.0 

5.0 

6.0 

7.0 

8.0 

9.0 

0 

0.3679 

0.1353 

0.0498 

0.0183 

0.0067 

0.0025 

0.0009 

0.0003 

0.0001 

i 

0.3679 

0.2707 

0.1494 

0.0733 

0.0337 

0.0149 

0.0064 

0.0027 

0.0011 

2 

0.1839 

0.2707 

0.2240 

0.1465 

0.0842 

0.0446 

0.0223 

0.0107 

0.0050 

3 

0.0613 

0.1804 

0.2240 

0.1954 

0.1404 

0.0892 

0.0521 

0.0286 

0.0150 

4 

0.0153 

0.0902 

0.1680 

0.1954 

0.1755 

0.1339 

0.0912 

0.0573 

0.0337 

5 

0.0031 

0.0361 

0.1008 

0.1563 

0.1755 

0.1606 

0.1277 

0.0916 

0.0607 

6 

0.0005 

0.0120 

0.0504 

0.1042 

0.1462 

0.1606 

0.1490 

0.1221 

0.0911 

7 

0.0001 

0.0034 

0.0216 

0.0595 

0.1044 

0.1377 

0.1490 

0.1396 

0.1171 

8 

0.0000 

0.0009 

0.0081 

0.0298 

0.0653 

0.1033 

0.1304 

0.1396 

0.1318 

9 

0.0000 

0.0002 

0.0027 

0.0132 

0.0363 

0.0688 

0.1014 

0.1241 

0.1318 

10 

0.0000 

0.0000 

0.0008 

0.0053 

0.0181 

0.0413 

0.0710 

0.0993 

0.1186 

11 

0.0000 

0.0000 

0.0002 

0.0019 

0.0082 

0.0225 

0.0452 

0.0722 

0.0970 

12 

0.0000 

0.0000 

0.0001 

0.0006 

0.0034 

0.0113 

0.0263 

0.0481 

0.0728 

13 

0.0000 

0.0000 

0.0000 

0.0002 

0.0013 

0.0052 

0.0142 

0.0296 

0.0504 

14 

0.0000 

0.0000 

0.0000 

0.0001 

0.0005 

0.0022 

0.0071 

0.0169 

0.0324 

15 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0009 

0.0033 

0.0090 

0.0194 

16 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0003 

0.0014 

0.0045 

0.0109 

17 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0006 

0.0021 

0.0058 

18 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0009 

0.0029 

19 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0004 

0.0014 

20 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0002 

0.0006 

21 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 

0.0003 

22 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0000 

0.0001 
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02711 

94873 

54921 

77640 

61545 

17147 

13748 

87455 

08999 

78804 

82173 

97594 

73881 

46071 

44492 

31864 

51574 

35350 

46943 

22665 

39437 

77082 

24544 

27503 

24590 

48155 

20226 

70178 

10169 

81084 

69202 

80561 

08199 

98883 

84568 

04269 

10538 

77843 

12034 

10524 

68935 

89450 

90696 

49006 

74591 

06315 

62386 

86848 

65643 

11084 


Apéndice B 

B.6 Tabla de números aleatorios 


08182 

75997 

79866 

58095 

83319 

80295 

79741 

74599 

84379 

90935 

31684 

63952 

09865 

14491 

99518 

93394 

34691 

14985 

78680 

06635 

98689 

17306 

25170 

65928 

87709 

30533 

89736 

97636 

37397 

93379 

56454 

59818 

45827 

74164 

71666 

46977 

00835 

93251 

87203 

36759 

49197 

85967 

01704 

19634 

21898 

19519 

22497 

16857 

42426 

84822 

92598 

49186 

88247 

39967 

04742 

92460 

85801 

53444 

65626 

58710 

55406 

17173 

69776 

14813 

50373 

28037 

91182 

32786 

65261 

11173 

34376 

36408 

57409 

91185 

10200 

61411 

23392 

47797 

56377 

71635 

08601 

81333 

53809 

32471 

46034 

36306 

22498 

19239 

85428 

55721 

26921 

28472 

98958 

07960 

66124 

89731 

95069 

18625 

92405 

25168 

89178 

68190 

05043 

17407 

48201 

83917 

11413 

72920 

67176 

93504 

42636 

38233 

16154 

96451 

57925 

29667 

30859 

22912 

90326 

42453 

88108 

72064 

58601 

32357 

90610 

32921 

19686 

12495 

93135 

95185 

77799 

52441 

88272 

22024 

80631 

72170 

37722 

55794 

14636 

05148 

54505 

50113 

21119 

25228 

90692 

43339 

65689 

76539 

27909 

05467 

21727 

51141 

72949 

76132 

92925 

92124 

92634 

35681 

43690 

89136 

35599 

84138 

36502 

01172 

46045 

46991 

33804 

80006 

35542 

61056 

75666 

87226 

33304 

57975 

03985 

21566 

65796 

72915 

81466 

89205 

97957 

11838 

10433 

21564 

51570 

73558 

27495 

34533 

57808 

47784 

40098 

97962 

89845 

28392 

78187 

06112 

08169 

11261 

25649 

43370 

28007 

06779 

72402 

62632 

53956 

24709 

06978 

15558 

37738 

24849 

70722 

71859 

83736 

06016 

94397 

12529 

24545 

06435 

52758 

45685 

90151 

46516 

49644 

92686 

84870 

86226 

40359 

28723 

15364 

69125 

12609 

57171 

86857 

31702 

53752 

90648 

24362 

83314 

00014 

19207 

69413 

97016 

86290 

73444 

38790 

53626 

93780 

18629 

68766 

24371 

74639 

30782 

41465 

51935 

05711 

09799 

79077 

88159 

33437 

68519 

03040 

03701 

28598 

70013 

63794 

53169 

97054 

60303 

23259 

96196 

20777 

21727 

81511 

51887 

16175 

53746 

46516 

70339 

62727 

95787 

89426 

93325 

86412 

57479 

54194 

52153 

19197 

81877 

26703 

95128 

48599 

09333 

12584 

24374 

31232 

61782 

44032 

28220 

39358 

53720 

80161 

83371 

15181 

11131 

12219 

55920 

69286 

76054 

21615 

80883 

36797 

82845 

39139 

90900 

18172 

35173 

95745 

53893 

86022 

77722 

52498 

84193 

22448 

22571 

13124 

36099 

13140 

37706 

44562 

57179 

44693 

67877 

01549 

24955 

25900 

63843 

95029 

93859 

93634 

20205 

66294 

41218 

94636 

49455 

76362 

83532 

31062 

69903 

91186 

65768 

55949 

72829 

47641 

93315 

80875 

28090 

97728 

52560 

34937 

79548 

76632 

46984 

61772 

92786 

22651 

07086 

89754 

44143 

97687 

65665 

29190 

43709 

11172 

34481 

95977 

47535 

25658 

73898 

20451 

24211 

97310 

60446 

73530 

62865 

96574 

13829 

72226 

32047 

93086 

00112 

20470 

17136 

28255 

86328 

07293 

38809 

87025 

52368 

59416 

34417 

70557 

86746 

55809 

53628 

12000 

17012 

77103 

00968 

07235 

10728 

42189 

33292 

51487 

64443 

09184 

62092 

46617 

99419 

64230 

95034 

85481 

07857 

42510 

82122 

04028 

36959 

87827 

12813 

08627 

80699 

13345 

51695 

69480 

46598 

04501 

40403 

91408 

32343 

48130 

49303 

90689 

46534 

78957 

77353 

39578 

77868 

22970 

84349 

09184 

70603 
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B.7 Valores Tde Wilcoxon 



2a 


.15 

.10 

.05 

.04 

.03 

.02 

.01 


OL 

n 

.075 

.050 

.025 

.020 

.015 

.010 

.005 

4 

0 







5 

1 

0 






6 

2 

2 

0 

0 




7 

4 

3 

2 

1 

0 

0 


8 

7 

5 

3 

3 

2 

1 

0 

9 

9 

8 

5 

5 

4 

3 

1 

10 

12 

10 

8 

7 

6 

5 

3 

11 

16 

13 

10 

9 

8 

7 

5 

12 

19 

17 

13 

12 

11 

9 

7 

13 

24 

21 

17 

16 

14 

12 

9 

14 

28 

25 

21 

19 

18 

15 

12 

15 

33 

30 

25 

23 

21 

19 

15 

16 

39 

35 

29 

28 

26 

23 

19 

17 

45 

41 

34 

33 

30 

27 

23 

18 

51 

47 

40 

38 

35 

32 

27 

19 

58 

53 

46 

43 

41 

37 

32 

20 

65 

60 

52 

50 

47 

43 

37 

21 

73 

67 

58 

56 

53 

49 

42 

22 

81 

75 

65 

63 

59 

55 

48 

23 

89 

83 

73 

70 

66 

62 

54 

24 

98 

91 

81 

78 

74 

69 

61 

25 

108 

100 

89 

86 

82 

76 

68 

26 

118 

110 

98 

94 

90 

84 

75 

27 

128 

119 

107 

103 

99 

92 

83 

28 

138 

130 

116 

112 

108 

101 

91 

29 

150 

140 

126 

122 

117 

110 

100 

30 

161 

151 

137 

132 

127 

120 

109 

31 

173 

163 

147 

143 

137 

130 

118 

32 

186 

175 

159 

154 

148 

140 

128 

33 

199 

187 

170 

165 

159 

151 

138 

34 

212 

200 

182 

177 

171 

162 

148 

35 

226 

213 

195 

189 

182 

173 

159 

40 

302 

286 

264 

257 

249 

238 

220 

50 

487 

466 

434 

425 

413 

397 

373 

60 

718 

690 

648 

636 

620 

600 

567 

70 

995 

960 

907 

891 

872 

846 

805 

80 

1,318 

1,276 

1,211 

1,192 

1,168 

1,136 

1,086 

90 

1,688 

1,638 

1,560 

1,537 

1,509 

1,471 

1,410 

100 

2,105 

2,045 

1,955 

1,928 

1,894 

1,850 

1,779 
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B.8 Factores de las tablas de control 


Número de 
elementos 
en la 
muestra, 

Tablas de 
promedios 

Tablas 
de rangos 

Factores de los 
limites de control 

Factores de la 
linea central 

Factores de los 
limites de control 

n 

4> 

d 2 

03 

04 

2 

1.880 

1.128 

0 

3.267 

3 

1.023 

1.693 

0 

2.575 

4 

.729 

2.059 

0 

2.282 

5 

.577 

2.326 

0 

2.115 

6 

.483 

2.534 

0 

2.004 

7 

.419 

2.704 

.076 

1.924 

8 

.373 

2.847 

.136 

1.864 

9 

.337 

2.970 

.184 

1.816 

10 

.308 

3.078 

.223 

1.777 

11 

.285 

3.173 

.256 

1.744 

12 

.266 

3.258 

.284 

1.716 

13 

.249 

3.336 

.308 

1.692 

14 

.235 

3.407 

.329 

1.671 

15 

.223 

3.472 

.348 

1.652 


FUENTE: Adaptado de American Society for Testing and Materials, Manual on 
Quality Control of Materials, 1951, tabla B2, p. 115. Para una tabla y una expli- 
cación más detalladas, veaAcheson J. Duncan, Quality Control and Industrial 
Statistlcs , 3a ed., Homewood, III: Richard D. Irwin, 1974, tabla M, p. 927. 
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Apéndice B 

B.9 Distribución de probabilidad binomial 


n = 1 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.950 

0.900 

0.800 

0.700 

0.600 

0.500 

0.400 

0.300 

0.200 

0.100 

0.050 

i 

0.050 

0.100 

0.200 

0.300 

0.400 

0.500 

0.600 

0.700 

0.800 

0.900 

0.950 


n = 2 

Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.903 

0.810 

0.640 

0.490 

0.360 

0.250 

0.160 

0.090 

0.040 

0.010 

0.003 

i 

0.095 

0.180 

0.320 

0.420 

0.480 

0.500 

0.480 

0.420 

0.320 

0.180 

0.095 

2 

0.003 

0.010 

0.040 

0.090 

0.160 

0.250 

0.360 

0.490 

0.640 

0.810 

0.903 


n= 3 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.857 

0.729 

0.512 

0.343 

0.216 

0.125 

0.064 

0.027 

0.008 

0.001 

0.000 

i 

0.135 

0.243 

0.384 

0.441 

0.432 

0.375 

0.288 

0.189 

0.096 

0.027 

0.007 

2 

0.007 

0.027 

0.096 

0.189 

0.288 

0.375 

0.432 

0.441 

0.384 

0.243 

0.135 

3 

0.000 

0.001 

0.008 

0.027 

0.064 

0.125 

0.216 

0.343 

0.512 

0.729 

0.857 


n= 4 

Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.815 

0.656 

0.410 

0.240 

0.130 

0.063 

0.026 

0.008 

0.002 

0.000 

0.000 

i 

0.171 

0.292 

0.410 

0.412 

0.346 

0.250 

0.154 

0.076 

0.026 

0.004 

0.000 

2 

0.014 

0.049 

0.154 

0.265 

0.346 

0.375 

0.346 

0.265 

0.154 

0.049 

0.014 

3 

0.000 

0.004 

0.026 

0.076 

0.154 

0.250 

0.346 

0.412 

0.410 

0.292 

0.171 

4 

0.000 

0.000 

0.002 

0.008 

0.026 

0.063 

0.130 

0.240 

0.410 

0.656 

0.815 


n = 5 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.774 

0.590 

0.328 

0.168 

0.078 

0.031 

0.010 

0.002 

0.000 

0.000 

0.000 

i 

0.204 

0.328 

0.410 

0.360 

0.259 

0.156 

0.077 

0.028 

0.006 

0.000 

0.000 

2 

0.021 

0.073 

0.205 

0.309 

0.346 

0.313 

0.230 

0.132 

0.051 

0.008 

0.001 

3 

0.001 

0.008 

0.051 

0.132 

0.230 

0.313 

0.346 

0.309 

0.205 

0.073 

0.021 

4 

0.000 

0.000 

0.006 

0.028 

0.077 

0.156 

0.259 

0.360 

0.410 

0.328 

0.204 

5 

0.000 

0.000 

0.000 

0.002 

0.010 

0.031 

0.078 

0.168 

0.328 

0.590 

0.774 
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n = 6 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.735 

0.531 

0.262 

0.118 

0.047 

0.016 

0.004 

0.001 

0.000 

0.000 

0.000 

i 

0.232 

0.354 

0.393 

0.303 

0.187 

0.094 

0.037 

0.010 

0.002 

0.000 

0.000 

2 

0.031 

0.098 

0.246 

0.324 

0.311 

0.234 

0.138 

0.060 

0.015 

0.001 

0.000 

3 

0.002 

0.015 

0.082 

0.185 

0.276 

0.313 

0.276 

0.185 

0.082 

0.015 

0.002 

4 

0.000 

0.001 

0.015 

0.060 

0.138 

0.234 

0.311 

0.324 

0.246 

0.098 

0.031 

5 

0.000 

0.000 

0.002 

0.010 

0.037 

0.094 

0.187 

0.303 

0.393 

0.354 

0.232 

6 

0.000 

0.000 

0.000 

0.001 

0.004 

0.016 

0.047 

0.118 

0.262 

0.531 

0.735 







n = 7 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.698 

0.478 

0.210 

0.082 

0.028 

0.008 

0.002 

0.000 

0.000 

0.000 

0.000 

i 

0.257 

0.372 

0.367 

0.247 

0.131 

0.055 

0.017 

0.004 

0.000 

0.000 

0.000 

2 

0.041 

0.124 

0.275 

0.318 

0.261 

0.164 

0.077 

0.025 

0.004 

0.000 

0.000 

3 

0.004 

0.023 

0.115 

0.227 

0.290 

0.273 

0.194 

0.097 

0.029 

0.003 

0.000 

4 

0.000 

0.003 

0.029 

0.097 

0.194 

0.273 

0.290 

0.227 

0.115 

0.023 

0.004 

5 

0.000 

0.000 

0.004 

0.025 

0.077 

0.164 

0.261 

0.318 

0.275 

0.124 

0.041 

6 

0.000 

0.000 

0.000 

0.004 

0.017 

0.055 

0.131 

0.247 

0.367 

0.372 

0.257 

7 

0.000 

0.000 

0.000 

0.000 

0.002 

0.008 

0.028 

0.082 

0.210 

0.478 

0.698 







n = 8 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.663 

0.430 

0.168 

0.058 

0.017 

0.004 

0.001 

0.000 

0.000 

0.000 

0.000 

i 

0.279 

0.383 

0.336 

0.198 

0.090 

0.031 

0.008 

0.001 

0.000 

0.000 

0.000 

2 

0.051 

0.149 

0.294 

0.296 

0.209 

0.109 

0.041 

0.010 

0.001 

0.000 

0.000 

3 

0.005 

0.033 

0.147 

0.254 

0.279 

0.219 

0.124 

0.047 

0.009 

0.000 

0.000 

4 

0.000 

0.005 

0.046 

0.136 

0.232 

0.273 

0.232 

0.136 

0.046 

0.005 

0.000 

5 

0.000 

0.000 

0.009 

0.047 

0.124 

0.219 

0.279 

0.254 

0.147 

0.033 

0.005 

6 

0.000 

0.000 

0.001 

0.010 

0.041 

0.109 

0.209 

0.296 

0.294 

0.149 

0.051 

7 

0.000 

0.000 

0.000 

0.001 

0.008 

0.031 

0.090 

0.198 

0.336 

0.383 

0.279 

8 

0.000 

0.000 

0.000 

0.000 

0.001 

0.004 

0.017 

0.058 

0.168 

0.430 

0.663 


(continúa) 
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B.9 Distribución de probabilidad binomial ( continuación ) 


n = 9 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.630 

0.387 

0.134 

0.040 

0.010 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.299 

0.387 

0.302 

0.156 

0.060 

0.018 

0.004 

0.000 

0.000 

0.000 

0.000 

2 

0.063 

0.172 

0.302 

0.267 

0.161 

0.070 

0.021 

0.004 

0.000 

0.000 

0.000 

3 

0.008 

0.045 

0.176 

0.267 

0.251 

0.164 

0.074 

0.021 

0.003 

0.000 

0.000 

4 

0.001 

0.007 

0.066 

0.172 

0.251 

0.246 

0.167 

0.074 

0.017 

0.001 

0.000 

5 

0.000 

0.001 

0.017 

0.074 

0.167 

0.246 

0.251 

0.172 

0.066 

0.007 

0.001 

6 

0.000 

0.000 

0.003 

0.021 

0.074 

0.164 

0.251 

0.267 

0.176 

0.045 

0.008 

7 

0.000 

0.000 

0.000 

0.004 

0.021 

0.070 

0.161 

0.267 

0.302 

0.172 

0.063 

8 

0.000 

0.000 

0.000 

0.000 

0.004 

0.018 

0.060 

0.156 

0.302 

0.387 

0.299 

9 

0.000 

0.000 

0.000 

0.000 

0.000 

0.002 

0.010 

0.040 

0.134 

0.387 

0.630 







n = 10 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.599 

0.349 

0.107 

0.028 

0.006 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.315 

0.387 

0.268 

0.121 

0.040 

0.010 

0.002 

0.000 

0.000 

0.000 

0.000 

2 

0.075 

0.194 

0.302 

0.233 

0.121 

0.044 

0.011 

0.001 

0.000 

0.000 

0.000 

3 

0.010 

0.057 

0.201 

0.267 

0.215 

0.117 

0.042 

0.009 

0.001 

0.000 

0.000 

4 

0.001 

0.011 

0.088 

0.200 

0.251 

0.205 

0.111 

0.037 

0.006 

0.000 

0.000 

5 

0.000 

0.001 

0.026 

0.103 

0.201 

0.246 

0.201 

0.103 

0.026 

0.001 

0.000 

6 

0.000 

0.000 

0.006 

0.037 

0.111 

0.205 

0.251 

0.200 

0.088 

0.011 

0.001 

7 

0.000 

0.000 

0.001 

0.009 

0.042 

0.117 

0.215 

0.267 

0.201 

0.057 

0.010 

8 

0.000 

0.000 

0.000 

0.001 

0.011 

0.044 

0.121 

0.233 

0.302 

0.194 

0.075 

9 

0.000 

0.000 

0.000 

0.000 

0.002 

0.010 

0.040 

0.121 

0.268 

0.387 

0.315 

10 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.006 

0.028 

0.107 

0.349 

0.599 







n = 11 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.569 

0.314 

0.086 

0.020 

0.004 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.329 

0.384 

0.236 

0.093 

0.027 

0.005 

0.001 

0.000 

0.000 

0.000 

0.000 

2 

0.087 

0.213 

0.295 

0.200 

0.089 

0.027 

0.005 

0.001 

0.000 

0.000 

0.000 

3 

0.014 

0.071 

0.221 

0.257 

0.177 

0.081 

0.023 

0.004 

0.000 

0.000 

0.000 

4 

0.001 

0.016 

0.111 

0.220 

0.236 

0.161 

0.070 

0.017 

0.002 

0.000 

0.000 

5 

0.000 

0.002 

0.039 

0.132 

0.221 

0.226 

0.147 

0.057 

0.010 

0.000 

0.000 

6 

0.000 

0.000 

0.010 

0.057 

0.147 

0.226 

0.221 

0.132 

0.039 

0.002 

0.000 

7 

0.000 

0.000 

0.002 

0.017 

0.070 

0.161 

0.236 

0.220 

0.111 

0.016 

0.001 

8 

0.000 

0.000 

0.000 

0.004 

0.023 

0.081 

0.177 

0.257 

0.221 

0.071 

0.014 

9 

0.000 

0.000 

0.000 

0.001 

0.005 

0.027 

0.089 

0.200 

0.295 

0.213 

0.087 

10 

0.000 

0.000 

0.000 

0.000 

0.001 

0.005 

0.027 

0.093 

0.236 

0.384 

0.329 

11 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.004 

0.020 

0.086 

0.314 

0.569 


794 


Apéndice B 

B.9 Distribución de probabilidad binomial ( continuación ) 


n= 12 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.540 

0.282 

0.069 

0.014 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.341 

0.377 

0.206 

0.071 

0.017 

0.003 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.099 

0.230 

0.283 

0.168 

0.064 

0.016 

0.002 

0.000 

0.000 

0.000 

0.000 

3 

0.017 

0.085 

0.236 

0.240 

0.142 

0.054 

0.012 

0.001 

0.000 

0.000 

0.000 

4 

0.002 

0.021 

0.133 

0.231 

0.213 

0.121 

0.042 

0.008 

0.001 

0.000 

0.000 

5 

0.000 

0.004 

0.053 

0.158 

0.227 

0.193 

0.101 

0.029 

0.003 

0.000 

0.000 

6 

0.000 

0.000 

0.016 

0.079 

0.177 

0.226 

0.177 

0.079 

0.016 

0.000 

0.000 

7 

0.000 

0.000 

0.003 

0.029 

0.101 

0.193 

0.227 

0.158 

0.053 

0.004 

0.000 

8 

0.000 

0.000 

0.001 

0.008 

0.042 

0.121 

0.213 

0.231 

0.133 

0.021 

0.002 

9 

0.000 

0.000 

0.000 

0.001 

0.012 

0.054 

0.142 

0.240 

0.236 

0.085 

0.017 

10 

0.000 

0.000 

0.000 

0.000 

0.002 

0.016 

0.064 

0.168 

0.283 

0.230 

0.099 

11 

0.000 

0.000 

0.000 

0.000 

0.000 

0.003 

0.017 

0.071 

0.206 

0.377 

0.341 

12 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.002 

0.014 

0.069 

0.282 

0.540 







n = 13 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.513 

0.254 

0.055 

0.010 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.351 

0.367 

0.179 

0.054 

0.011 

0.002 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.111 

0.245 

0.268 

0.139 

0.045 

0.010 

0.001 

0.000 

0.000 

0.000 

0.000 

3 

0.021 

0.100 

0.246 

0.218 

0.111 

0.035 

0.006 

0.001 

0.000 

0.000 

0.000 

4 

0.003 

0.028 

0.154 

0.234 

0.184 

0.087 

0.024 

0.003 

0.000 

0.000 

0.000 

5 

0.000 

0.006 

0.069 

0.180 

0.221 

0.157 

0.066 

0.014 

0.001 

0.000 

0.000 

6 

0.000 

0.001 

0.023 

0.103 

0.197 

0.209 

0.131 

0.044 

0.006 

0.000 

0.000 

7 

0.000 

0.000 

0.006 

0.044 

0.131 

0.209 

0.197 

0.103 

0.023 

0.001 

0.000 

8 

0.000 

0.000 

0.001 

0.014 

0.066 

0.157 

0.221 

0.180 

0.069 

0.006 

0.000 

9 

0.000 

0.000 

0.000 

0.003 

0.024 

0.087 

0.184 

0.234 

0.154 

0.028 

0.003 

10 

0.000 

0.000 

0.000 

0.001 

0.006 

0.035 

0.111 

0.218 

0.246 

0.100 

0.021 

11 

0.000 

0.000 

0.000 

0.000 

0.001 

0.010 

0.045 

0.139 

0.268 

0.245 

0.111 

12 

0.000 

0.000 

0.000 

0.000 

0.000 

0.002 

0.011 

0.054 

0.179 

0.367 

0.351 

13 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.010 

0.055 

0.254 

0.513 
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B.9 Distribución de probabilidad binomial ( conclusión ) 


n = 14 


Probabilidad 


X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.488 

0.229 

0.044 

0.007 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.359 

0.356 

0.154 

0.041 

0.007 

0.001 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.123 

0.257 

0.250 

0.113 

0.032 

0.006 

0.001 

0.000 

0.000 

0.000 

0.000 

3 

0.026 

0.114 

0.250 

0.194 

0.085 

0.022 

0.003 

0.000 

0.000 

0.000 

0.000 

4 

0.004 

0.035 

0.172 

0.229 

0.155 

0.061 

0.014 

0.001 

0.000 

0.000 

0.000 

5 

0.000 

0.008 

0.086 

0.196 

0.207 

0.122 

0.041 

0.007 

0.000 

0.000 

0.000 

6 

0.000 

0.001 

0.032 

0.126 

0.207 

0.183 

0.092 

0.023 

0.002 

0.000 

0.000 

7 

0.000 

0.000 

0.009 

0.062 

0.157 

0.209 

0.157 

0.062 

0.009 

0.000 

0.000 

8 

0.000 

0.000 

0.002 

0.023 

0.092 

0.183 

0.207 

0.126 

0.032 

0.001 

0.000 

9 

0.000 

0.000 

0.000 

0.007 

0.041 

0.122 

0.207 

0.196 

0.086 

0.008 

0.000 

10 

0.000 

0.000 

0.000 

0.001 

0.014 

0.061 

0.155 

0.229 

0.172 

0.035 

0.004 

11 

0.000 

0.000 

0.000 

0.000 

0.003 

0.022 

0.085 

0.194 

0.250 

0.114 

0.026 

12 

0.000 

0.000 

0.000 

0.000 

0.001 

0.006 

0.032 

0.113 

0.250 

0.257 

0.123 

13 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.007 

0.041 

0.154 

0.356 

0.359 

14 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.001 

0.007 

0.044 

0.229 

0.488 







n = 15 











Probabilidad 






X 

0.05 

0.10 

0.20 

0.30 

0.40 

0.50 

0.60 

0.70 

0.80 

0.90 

0.95 

0 

0.463 

0.206 

0.035 

0.005 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

i 

0.366 

0.343 

0.132 

0.031 

0.005 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

2 

0.135 

0.267 

0.231 

0.092 

0.022 

0.003 

0.000 

0.000 

0.000 

0.000 

0.000 

3 

0.031 

0.129 

0.250 

0.170 

0.063 

0.014 

0.002 

0.000 

0.000 

0.000 

0.000 

4 

0.005 

0.043 

0.188 

0.219 

0.127 

0.042 

0.007 

0.001 

0.000 

0.000 

0.000 

5 

0.001 

0.010 

0.103 

0.206 

0.186 

0.092 

0.024 

0.003 

0.000 

0.000 

0.000 

6 

0.000 

0.002 

0.043 

0.147 

0.207 

0.153 

0.061 

0.012 

0.001 

0.000 

0.000 

7 

0.000 

0.000 

0.014 

0.081 

0.177 

0.196 

0.118 

0.035 

0.003 

0.000 

0.000 

8 

0.000 

0.000 

0.003 

0.035 

0.118 

0.196 

0.177 

0.081 

0.014 

0.000 

0.000 

9 

0.000 

0.000 

0.001 

0.012 

0.061 

0.153 

0.207 

0.147 

0.043 

0.002 

0.000 

10 

0.000 

0.000 

0.000 

0.003 

0.024 

0.092 

0.186 

0.206 

0.103 

0.010 

0.001 

11 

0.000 

0.000 

0.000 

0.001 

0.007 

0.042 

0.127 

0.219 

0.188 

0.043 

0.005 

12 

0.000 

0.000 

0.000 

0.000 

0.002 

0.014 

0.063 

0.170 

0.250 

0.129 

0.031 

13 

0.000 

0.000 

0.000 

0.000 

0.000 

0.003 

0.022 

0.092 

0.231 

0.267 

0.135 

14 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.005 

0.031 

0.132 

0.343 

0.366 

15 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.000 

0.005 

0.035 

0.206 

0.463 
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Apéndice B 

B.10A Valores críticos del estadístico d de Durbin-Watson (a = .05) 


k = 1 k= 2 k = 3 k = 4 k = 5 


n 

dl_,. 05 

du, .05 

d¡_,.05 

du,. 05 

dl_,. 05 

du,. 05 

d¡.,. 05 

du,. 05 

dl_,. 05 

du,. 05 

15 

1.08 

1.36 

0.95 

1.54 

0.82 

1.75 

0.69 

1.97 

0.56 

2.21 

16 

1.10 

1.37 

0.98 

1.54 

0.86 

1.73 

0.74 

1.93 

0.62 

2.15 

17 

1.13 

1.38 

1.02 

1.54 

0.90 

1.71 

0.78 

1.90 

0.67 

2.10 

18 

1.16 

1.39 

1.05 

1.53 

0.93 

1.69 

0.82 

1.87 

0.71 

2.06 

19 

1.18 

1.40 

1.08 

1.53 

0.97 

1.68 

0.86 

1.85 

0.75 

2.02 

20 

1.20 

1.41 

1.10 

1.54 

1.00 

1.68 

0.90 

1.83 

0.79 

1.99 

21 

1.22 

1.42 

1.13 

1.54 

1.03 

1.67 

0.93 

1.81 

0.83 

1.96 

22 

1.24 

1.43 

1.15 

1.54 

1.05 

1.66 

0.96 

1.80 

0.86 

1.94 

23 

1.26 

1.44 

1.17 

1.54 

1.08 

1.66 

0.99 

1.79 

0.90 

1.92 

24 

1.27 

1.45 

1.19 

1.55 

1.10 

1.66 

1.01 

1.78 

0.93 

1.90 

25 

1.29 

1.45 

1.21 

1.55 

1.12 

1.66 

1.04 

1.77 

0.95 

1.89 

26 

1.30 

1.46 

1.22 

1.55 

1.14 

1.65 

1.06 

1.76 

0.98 

1.88 

27 

1.32 

1.47 

1.24 

1.56 

1.16 

1.65 

1.08 

1.76 

1.01 

1.86 

28 

1.33 

1.48 

1.26 

1.56 

1.18 

1.65 

1.10 

1.75 

1.03 

1.85 

29 

1.34 

1.48 

1.27 

1.56 

1.20 

1.65 

1.12 

1.74 

1.05 

1.84 

30 

1.35 

1.49 

1.28 

1.57 

1.21 

1.65 

1.14 

1.74 

1.07 

1.83 

31 

1.36 

1.50 

1.30 

1.57 

1.23 

1.65 

1.16 

1.74 

1.09 

1.83 

32 

1.37 

1.50 

1.31 

1.57 

1.24 

1.65 

1.18 

1.73 

1.11 

1.82 

33 

1.38 

1.51 

1.32 

1.58 

1.26 

1.65 

1.19 

1.73 

1.13 

1.81 

34 

1.39 

1.51 

1.33 

1.58 

1.27 

1.65 

1.21 

1.73 

1.15 

1.81 

35 

1.40 

1.52 

1.34 

1.58 

1.28 

1.65 

1.22 

1.73 

1.16 

1.80 

36 

1.41 

1.52 

1.35 

1.59 

1.29 

1.65 

1.24 

1.73 

1.18 

1.80 

37 

1.42 

1.53 

1.36 

1.59 

1.31 

1.66 

1.25 

1.72 

1.19 

1.80 

38 

1.43 

1.54 

1.37 

1.59 

1.32 

1.66 

1.26 

1.72 

1.21 

1.79 

39 

1.43 

1.54 

1.38 

1.60 

1.33 

1.66 

1.27 

1.72 

1.22 

1.79 

40 

1.44 

1.54 

1.39 

1.60 

1.34 

1.66 

1.29 

1.72 

1.23 

1.79 

45 

1.48 

1.57 

1.43 

1.62 

1.38 

1.67 

1.34 

1.72 

1.29 

1.78 

50 

1.50 

1.59 

1.46 

1.63 

1.42 

1.67 

1.38 

1.72 

1.34 

1.77 

55 

1.53 

1.60 

1.49 

1.64 

1.45 

1.68 

1.41 

1.72 

1.38 

1.77 

60 

1.55 

1.62 

1.51 

1.65 

1.48 

1.69 

1.44 

1.73 

1.41 

1.77 

65 

1.57 

1.63 

1.54 

1.66 

1.50 

1.70 

1.47 

1.73 

1.44 

1.77 

70 

1.58 

1.64 

1.55 

1.67 

1.52 

1.70 

1.49 

1.74 

1.46 

1.77 

75 

1.60 

1.65 

1.57 

1.68 

1.54 

1.71 

1.51 

1.74 

1.49 

1.77 

80 

1.61 

1.66 

1.59 

1.69 

1.56 

1.72 

1.53 

1.74 

1.51 

1.77 

85 

1.62 

1.67 

1.60 

1.70 

1.57 

1.72 

1.55 

1.75 

1.52 

1.77 

90 

1.63 

1.68 

1.61 

1.70 

1.59 

1.73 

1.57 

1.75 

1.54 

1.78 

95 

1.64 

1.69 

1.62 

1.71 

1.60 

1.73 

1.58 

1.75 

1.56 

1.78 

100 

1.65 

1.69 

1.63 

1.72 

1.61 

1.74 

1.59 

1.76 

1.57 

1.78 


FUENTE: J. Durbin y G. S. Watson, “Testing for Correlation in Least Squares Regression, II”, Biometrika 30 (1951), pp. 159-178. Reproducido con el permiso de Biometrika 
Trustees. 
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Apéndice B 

B.10B Valores críticos del estadístico d de Durbin-Watson (a = .025) 


n 


k = 1 


k = 2 


k = 3 


k= 4 


ir» 

II 

•ie 

d¡_,. 025 

du,. 025 

di.,. 025 

du,. 025 

d¡_,. 025 

du,. 025 

di.,. 025 

du,. 025 

di.,. 025 

du,. 025 

15 

0.95 

1.23 

0.83 

1.40 

0.71 

1.61 

0.59 

1.84 

0.48 

2.09 

16 

0.98 

1.24 

0.86 

1.40 

0.75 

1.59 

0.64 

1.80 

0.53 

2.03 

17 

1.01 

1.25 

0.90 

1.40 

0.79 

1.58 

0.68 

1.77 

0.57 

1.98 

18 

1.03 

1.26 

0.93 

1.40 

0.82 

1.56 

0.72 

1.74 

0.62 

1.93 

19 

1.06 

1.28 

0.96 

1.41 

0.86 

1.55 

0.76 

1.72 

0.66 

1.90 

20 

1.08 

1.28 

0.99 

1.41 

0.89 

1.55 

0.79 

1.70 

0.70 

1.87 

21 

1.10 

1.30 

1.01 

1.41 

0.92 

1.54 

0.83 

1.69 

0.73 

1.84 

22 

1.12 

1.31 

1.04 

1.42 

0.95 

1.54 

0.86 

1.68 

0.77 

1.82 

23 

1.14 

1.32 

1.06 

1.42 

0.97 

1.54 

0.89 

1.67 

0.80 

1.80 

24 

1.16 

1.33 

1.08 

1.43 

1.00 

1.54 

0.91 

1.66 

0.83 

1.79 

25 

1.18 

1.34 

1.10 

1.43 

1.02 

1.54 

0.94 

1.65 

0.86 

1.77 

26 

1.19 

1.35 

1.12 

1.44 

1.04 

1.54 

0.96 

1.65 

0.88 

1.76 

27 

1.21 

1.36 

1.13 

1.44 

1.06 

1.54 

0.99 

1.64 

0.91 

1.75 

28 

1.22 

1.37 

1.15 

1.45 

1.08 

1.54 

1.01 

1.64 

0.93 

1.74 

29 

1.24 

1.38 

1.17 

1.45 

1.10 

1.54 

1.03 

1.63 

0.96 

1.73 

30 

1.25 

1.38 

1.18 

1.46 

1.12 

1.54 

1.05 

1.63 

0.98 

1.73 

31 

1.26 

1.39 

1.20 

1.47 

1.13 

1.55 

1.07 

1.63 

1.00 

1.72 

32 

1.27 

1.40 

1.21 

1.47 

1.15 

1.55 

1.08 

1.63 

1.02 

1.71 

33 

1.28 

1.41 

1.22 

1.48 

1.16 

1.55 

1.10 

1.63 

1.04 

1.71 

34 

1.29 

1.41 

1.24 

1.48 

1.17 

1.55 

1.12 

1.63 

1.06 

1.70 

35 

1.30 

1.42 

1.25 

1.48 

1.19 

1.55 

1.13 

1.63 

1.07 

1.70 

36 

1.31 

1.43 

1.26 

1.49 

1.20 

1.56 

1.15 

1.63 

1.09 

1.70 

37 

1.32 

1.43 

1.27 

1.49 

1.21 

1.56 

1.16 

1.62 

1.10 

1.70 

38 

1.33 

1.44 

1.28 

1.50 

1.23 

1.56 

1.17 

1.62 

1.12 

1.70 

39 

1.34 

1.44 

1.29 

1.50 

1.24 

1.56 

1.19 

1.63 

1.13 

1.69 

40 

1.35 

1.45 

1.30 

1.51 

1.25 

1.57 

1.20 

1.63 

1.15 

1.69 

45 

1.39 

1.48 

1.34 

1.53 

1.30 

1.58 

1.25 

1.63 

1.21 

1.69 

50 

1.42 

1.50 

1.38 

1.54 

1.34 

1.59 

1.30 

1.64 

1.26 

1.69 

55 

1.45 

1.52 

1.41 

1.56 

1.37 

1.60 

1.33 

1.64 

1.30 

1.69 

60 

1.47 

1.54 

1.44 

1.57 

1.40 

1.61 

1.37 

1.65 

1.33 

1.69 

65 

1.49 

1.55 

1.46 

1.59 

1.43 

1.62 

1.40 

1.66 

1.36 

1.69 

70 

1.51 

1.57 

1.48 

1.60 

1.45 

1.63 

1.42 

1.66 

1.39 

1.70 

75 

1.53 

1.58 

1.50 

1.61 

1.47 

1.64 

1.45 

1.67 

1.42 

1.70 

80 

1.54 

1.59 

1.52 

1.62 

1.49 

1.65 

1.47 

1.67 

1.44 

1.70 

85 

1.56 

1.60 

1.53 

1.63 

1.51 

1.65 

1.49 

1.68 

1.46 

1.71 

90 

1.57 

1.61 

1.55 

1.64 

1.53 

1.66 

1.50 

1.69 

1.48 

1.71 

95 

1.58 

1.62 

1.56 

1.65 

1.54 

1.67 

1.52 

1.69 

1.50 

1.71 

100 

1.59 

1.63 

1.57 

1.65 

1.55 

1.67 

1.53 

1.70 

1.51 

1.72 


FUENTE: J. Durbin y G. S. Watson, “Testing for Correlation in Least Squares Regression, II”, Biometrika 30 (1951), pp. 159-178. Reproducido con el permiso de Biometrika 
Trustees. 
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Apéndice B 

B.10C Valores críticos del estadístico d de Durbin-Watson (a = .01) 


k = 1 k= 2 k = 3 k = 4 k = 5 


n 

^£,.01 

du,m 

^£,.01 

du,m 

^£,.01 

du,m 

^£,.01 

du ,. oí 

^£,.01 

du,m 

15 

0.81 

1.07 

0.70 

1.25 

0.59 

1.46 

0.49 

1.70 

0.39 

1.96 

16 

0.84 

1.09 

0.74 

1.25 

0.63 

1.44 

0.53 

1.66 

0.44 

1.90 

17 

0.87 

1.10 

0.77 

1.25 

0.67 

1.43 

0.57 

1.63 

0.48 

1.85 

18 

0.90 

1.12 

0.80 

1.26 

0.71 

1.42 

0.61 

1.60 

0.52 

1.80 

19 

0.93 

1.13 

0.83 

1.26 

0.74 

1.41 

0.65 

1.58 

0.56 

1.77 

20 

0.95 

1.15 

0.86 

1.27 

0.77 

1.41 

0.68 

1.57 

0.60 

1.74 

21 

0.97 

1.16 

0.89 

1.27 

0.80 

1.41 

0.72 

1.55 

0.63 

1.71 

22 

1.00 

1.17 

0.91 

1.28 

0.83 

1.40 

0.75 

1.54 

0.66 

1.69 

23 

1.02 

1.19 

0.94 

1.29 

0.86 

1.40 

0.77 

1.53 

0.70 

1.67 

24 

1.04 

1.20 

0.96 

1.30 

0.88 

1.41 

0.80 

1.53 

0.72 

1.66 

25 

1.05 

1.21 

0.98 

1.30 

0.90 

1.41 

0.83 

1.52 

0.75 

1.65 

26 

1.07 

1.22 

1.00 

1.31 

0.93 

1.41 

0.85 

1.52 

0.78 

1.64 

27 

1.09 

1.23 

1.02 

1.32 

0.95 

1.41 

0.88 

1.51 

0.81 

1.63 

28 

1.10 

1.24 

1.04 

1.32 

0.97 

1.41 

0.90 

1.51 

0.83 

1.62 

29 

1.12 

1.25 

1.05 

1.33 

0.99 

1.42 

0.92 

1.51 

0.85 

1.61 

30 

1.13 

1.26 

1.07 

1.34 

1.01 

1.42 

0.94 

1.51 

0.88 

1.61 

31 

1.15 

1.27 

1.08 

1.34 

1.02 

1.42 

0.96 

1.51 

0.90 

1.60 

32 

1.16 

1.28 

1.10 

1.35 

1.04 

1.43 

0.98 

1.51 

0.92 

1.60 

33 

1.17 

1.29 

1.11 

1.36 

1.05 

1.43 

1.00 

1.51 

0.94 

1.59 

34 

1.18 

1.30 

1.13 

1.36 

1.07 

1.43 

1.01 

1.51 

0.95 

1.59 

35 

1.19 

1.31 

1.14 

1.37 

1.08 

1.44 

1.03 

1.51 

0.97 

1.59 

36 

1.21 

1.32 

1.15 

1.38 

1.10 

1.44 

1.04 

1.51 

0.99 

1.59 

37 

1.22 

1.32 

1.16 

1.38 

1.11 

1.45 

1.06 

1.51 

1.00 

1.59 

38 

1.23 

1.33 

1.18 

1.39 

1.12 

1.45 

1.07 

1.52 

1.02 

1.58 

39 

1.24 

1.34 

1.19 

1.39 

1.14 

1.45 

1.09 

1.52 

1.03 

1.58 

40 

1.25 

1.34 

1.20 

1.40 

1.15 

1.46 

1.10 

1.52 

1.05 

1.58 

45 

1.29 

1.38 

1.24 

1.42 

1.20 

1.48 

1.16 

1.53 

1.11 

1.58 

50 

1.32 

1.40 

1.28 

1.45 

1.24 

1.49 

1.20 

1.54 

1.16 

1.59 

55 

1.36 

1.43 

1.32 

1.47 

1.28 

1.51 

1.25 

1.55 

1.21 

1.59 

60 

1.38 

1.45 

1.35 

1.48 

1.32 

1.52 

1.28 

1.56 

1.25 

1.60 

65 

1.41 

1.47 

1.38 

1.50 

1.35 

1.53 

1.31 

1.57 

1.28 

1.61 

70 

1.43 

1.49 

1.40 

1.52 

1.37 

1.55 

1.34 

1.58 

1.31 

1.61 

75 

1.45 

1.50 

1.42 

1.53 

1.39 

1.56 

1.37 

1.59 

1.34 

1.62 

80 

1.47 

1.52 

1.44 

1.54 

1.42 

1.57 

1.39 

1.60 

1.36 

1.62 

85 

1,48 

1.53 

1.46 

1.55 

1.43 

1.58 

1.41 

1.60 

1.39 

1.63 

90 

1.50 

1.54 

1.47 

1.56 

1.45 

1.59 

1.43 

1.61 

1.41 

1.64 

95 

1.51 

1.55 

1.49 

1.57 

1.47 

1.60 

1.45 

1.62 

1.42 

1.64 

100 

1.52 

1.56 

1.50 

1.58 

1.48 

1.60 

1.46 

1.63 

1.44 

1.65 


FUENTE: J. Durbin y G. S. Watson, “Testing for Correlation in Least Squares Regression, II", Biometrika 30 (1951), pp. 159-178. Reproducido con el permiso de Biometrika 
Trustees. 
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Apéndice C: Respuestas 

Respuestas a los ejercicios impares de cada capítulo 


CAPÍTULO 1 

1. a) 

De intervalo 

b) 

De razón 

c) 

De intervalo 

d ) 

Nominal 

e) 

Ordinal 

f) 

De razón 


3. Las respuestas variarán. 

5. Los datos cualitativos no son numéricos, mientras que los 

cuantitativos sí lo son. Los ejemplos varían según el estudiante. 

7. Una variable discreta puede asumir sólo ciertos valores. Una 

variable continua puede asumir una infinidad de valores dentro de 
cierto intervalo dado. El número de Infracciones de tránsito que se 
levantaron diariamente durante el mes de febrero en Garden City 
Beach, Carolina del Sur, constituye una variable discreta. El peso 
de los camiones comerciales que pasan por la estación de pesaje 
ubicada en el kilómetro 195 en la autopista interestatal 95 en 
Carolina del Norte constituye una variable continua. 

9. a) Ordinal 

b) De razón 

c) El sistema más nuevo proporciona información sobre la 
distancia entre salidas. 

11. Si usted estuviera usando esta tienda como un establecimiento 
típico de Barnes & Noble, entonces serían datos simples. Sin 
embargo, si usted la considerara como la única tienda de Interés, 
los datos serían poblacionales. 



Variable discreta 

Variable continua 

Cualitativa 

ti) Género 

d) Preferencia por el refresco 


Cuantitativa 

f) Resultados del SAT 

g) Posición del estudiante 
en clase 

h) Evaluación de un 
profesor de finanzas 

1) Número de computadoras 
domésticas 

a) Salario 

c) Volumen de ventas de 
reproductores MP3 
e) Temperatura 



Discreta 

Continua 

Nominal 

b) Género 


Ordinal 

d) Preferencia por el refresco 
g) Posición del estudiante 
en clase 

ti) Evaluación de un profesor 
de finanzas 


De intervalo 

f) Resultados del SAT 

e) Temperatura 

De razón 

i) Número de computadoras 
domésticas 

a) Salarlo 

c) Volumen de ventas 
de reproductores MP3 


15. Según la información de la muestra, 120/300 o 40% aceptarían una 
transferencia en el trabajo. 

17. a) Las ventas totales aumentaron a 1 06 041 , calculado por 
1 255 337 - 1 149 296, es decir, 9.2%. 


b) La participación de mercado es: 



2010 

2009 

General Motors 

22.9% 

22.0% 

Ford Motor 

19.9% 

16.2% 

Chrysler 

11.3% 

12.7% 

Toyota 

15.8% 

19.7% 

American Honda 

1 1 .8% 

12.4% 

Nissan NA 

10.6% 

9.4% 

Hyundai 

5.1% 

4.8% 

Mazda 

2.6% 

2.8% 


Ford ganó 3.7% y Toyota perdió 3.9% de sus participaciones 
en el mercado. 

c) Los cambios porcentuales son: 


General Motors 

Aumento de 13.7% 

Ford Motor 

Aumento de 34.3% 

Chrysler 

Decremento de 3.2% 

Toyota 

Decremento de 12.4% 

American Honda 

Aumento de 3.9% 

Nissan NA 

Aumento de 22.8% 

Hyundai 

Aumento de 17.0% 

Mazda 

Aumento de 2.9% 


Ford y Nissan tuvieron aumentos de más de 20%. General Motors y 
Hyundai tuvieron incrementos de más de 10%. En tanto, Toyota 
tuvo una disminución de más de 1 0%. 

19. Las ganancias aumentaron cada año con respecto al anterior hasta 
alcanzar un gran pico en 2008. Después tuvieron una caída 
Importante en 2009. 

21. a) Liga es una variable cualitativa; las otras son cuantitativas. 

b) Liga es una variable de nivel nominal; las otras son variables de 
nivel de razón. 

CAPÍTULO 2 

1. 25% de participación de mercado. 


Estación 

Frecuencia 

Frecuencia relativa 

Invierno 

100 

.10 

Primavera 

300 

.30 

Verano 

400 

.40 

Otoño 

200 

.20 


1 000 

1.00 


5. a) Tabla de frecuencias 


Color 

Frecuencia 

Frecuencia relativa 

Blanco brillante 

130 

0.10 

Negro metálico 

104 

0.08 

Lima magnético 

325 

0.25 

Naranja 

455 

0.35 

Rojo fusión 

286 

0.22 

Total 

1 300 

1.00 


800 


Gráfica de frecuencia vs. color 
500 


400 



Blanco Negro Lima Naranja Rojo 
brillante metálico magnético fusión 


Color 



d) 350 000 naranja, 250 000 lima, 220 000 rojos, 100 000 blancos 
y 80 000 negros, calculados multiplicando la frecuencia relativa 
por la producción total de 1 000 000 de unidades de 
producción. 

7. 2 5 = 32, 2 6 = 64; por lo tanto, 6 clases. 

9. 2 7 = 128, 2 8 = 256 sugiere 8 clases. 

$567 - $235 

i > = 41 Intervalos de clase de 40, 45 o 50 serian 

8 

aceptables. 


11 a) 2 4 = 16 Sugiere 5 clases. 

31 - 25 

b ) i > = 1 .2 Utilice un Intervalo de 1 .5. 

5 

c) 24 


Unidades 

f 

Frecuencia relativa 

24.0 hasta 25.5 

2 

0.125 

25.5 hasta 27.0 

4 

0.250 

27.0 hasta 28.5 

8 

0.500 

28.5 hasta 30.0 

0 

0.000 

30.0 hasta 31.5 

2 

0.125 

Total 

16 

1.000 


e) La concentración más grande se encuentra en la clase de 27.0 
a 28.5 (8). 


Número 
de visitas 

f 

0 hasta 3 

9 

3 hasta 6 

21 

6 hasta 9 

13 

9 hasta 1 2 

4 

12 hasta 15 

3 

15 hasta 18 

1 

Total 

51 


15. 


b) 


c) 


17 . 


El grupo más grande de compradores (21) compra en el BiLo 
Supermarket 3, 4 o 5 veces en un lapso de un mes. Algunos 
clientes visitan la tienda sólo una vez durante el mes, pero 
otros compran tanto como 15 veces. 


Número 
de visitas 

Porcentaje 
del total 

0 hasta 3 

17.65 

3 hasta 6 

41.18 

6 hasta 9 

25.49 

9 hasta 1 2 

7.84 

1 2 hasta 1 5 

5.88 

1 5 hasta 1 8 

1.96 

Total 

100.00 


a) 

b) 

c) 

d) 

e) 

f) 

9) 

a) 

b) 

c) 


Hlstograma 

100 

5 

28 

0.28 

12.5 
13 
50 

1.5 mil millas, o 1 500 millas 



3 6 9 12 15 

Millas de viajero frecuente 


d) X 

e) 

' tn 


1.5, Y = 5 


o 

■o 

CS 



- 1.5 1.5 4.5 7.5 1(1 


f) En el caso de los 50 empleados, alrededor de la mitad viajó 
entre 6 000 y 9 000 millas. Cinco empleados viajaron menos de 
3 000 millas y 2 viajaron más de 12 000 millas. 

19. 

a) 40 

b) 5 

c) 11 o 12 

d) Aproximadamente $1 8/hr 

e) Aproximadamente $9/hr 

f ) Aproximadamente 75% 

21. a) 5 


Millas 
de viajero 
frecuente 

f 

FC 

0 hasta 3 

5 

5 

3 hasta 6 

12 

17 

6 hasta 9 

23 

40 

9 hasta 1 2 

8 

48 

12 hasta 15 

2 

50 


801 




80% 


60% 

50% 

40% 

20 % 


“ 0 3 6 9 12 15 

Millas de viajero frecuente 

d) Aproximadamente 8.7 mil millas. 

23. a) Una variable cualitativa utiliza tanto la escala de medición 
nominal como la ordinal. Por lo general es resultado de 
conteos. Las variables cuantitativas son discretas o continuas. 
Existe un orden natural en el caso de los resultados de una 
variable cuantitativa. Las variables cuantitativas pueden utilizar 
la escala de medición de intervalo o de razón. 

b) Ambos tipos de variables se pueden utilizar para muestras y 
poblaciones. 

25. a) Tabla de frecuencias. 

b) 

160 
140 
120 
100 
80 
60 
40 
20 
0 


□ Actividades planeadas 
H Actividades no planeadas 

□ No hay seguridad 

□ No hay respuesta 


d) Una gráfica de pastel sería mejor, ya que muestra con claridad 
que cerca de la mitad de los clientes prefieren las actividades 
no planeadas. 

27. 2 6 = 64 y 2 7 = 128, sugieren 7 clases. 

29. a) 5, ya que 2 4 = 16 < 25 y 2 5 = 32 > 25 
48 - 16 

b) i > = 6.4 Utilice un intervalo de 7. 

5 

c) 15 


Clase 

Frecuencia 


1 5 hasta 22 

III 

3 

22 hasta 29 

Mili 

8 

29 hasta 36 

Mil 

7 

36 hasta 43 

Utt 

5 

43 hasta 50 

II 

2 

25 


e) Es casi simétrica; la mayoría de los valores se encuentran entre 
22 y 36. 




Actividades Actividades No hay No hay 
planeadas no planeadas seguridad respuesta 





31. 


33. 


35. 

37. 


a) 2 5 = 32, 2 6 = 64, 6 clases recomendadas. 
10 - 1 

ib) / = — - — =1.5, use un intervalo de 2. 

c) 0 


Clase 

Frecuencia 

0 hasta 2 

1 

2 hasta 4 

5 

4 hasta 6 

12 

6 hasta 8 

17 

8 hasta 10 

8 


e) La distribución es casi simétrica, o en forma de campana, con 
un gran pico en medio de las dos clases de 4 hasta 8. 


Clase 

Frecuencia 

0 hasta 200 

19 

200 hasta 400 

1 

400 hasta 600 

4 

600 hasta 800 

1 

800 hasta 1000 

2 


Esta distribución tiene un sesgo positivo, con una larga “cola” hacia 
la derecha, o valores positivos. Note que las 7 tonadas más 
populares representan 4 342 reproducciones de un total de 5 968, o 
cerca del 73% de todas las reproducciones. 

a) 56 c) 55 

b) 10 (calculado por 60 - 50) d) 17 

a) $30.50M calculado mediante ($265 - $82)/6. 

b) $35 


$ 70 hasta $1 05 

4 

1 05 hasta 

140 

17 

1 40 hasta 

175 

14 

1 75 hasta 

210 

2 

21 0 hasta 

245 

6 

245 hasta 

280 

1 


39. 


d) Las compras variaron de cantidades bajas de alrededor de $70 
a alrededor de $280. La concentración se encuentra en las 
clases de $1 05 a $1 40 y de $1 40 a $1 75. 

Depreciación 
Seguro 
Reparaciones 
Interés 
Combustible 

0 200 400 600 800 1 000 

Cantidad 




Salarios 

73% 
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Frecuencia 


Ingreso 

Porcentaje 

Acumulado 

Salarios 

73 

73 

Dividendos 

11 

84 

IRA 

8 

92 

Pensiones 

3 

95 

Seguro social 

2 

97 

Otros 

3 

100 


Por mucho, la mayor parte del ingreso en Carolina del Sur es el que 
se gana en el trabajo. Casi tres cuartas partes del ingreso bruto 
ajustado provienen de sueldos y salarios. Los dividendos y el IRA 
contribuyen con otro 1 0% cada uno. 

43. a) Como 2 6 = 64 < 70 < 128 = 2 7 , se recomiendan 7 clases. El 
intervalo deberá ser (1 002.2 - 3.3)/7 = 142.7, por lo menos. 
Utilice 150 como valor conveniente. 
b) 



Valor 


45. 

47. 


a) 

b ) 

c) 
a) 


Gráfica de pastel. 

215, calculado por 0.43 x 500 

78% están ya sea en un templo (43%) o al aire libre (35%). 


Gráfica de cantidad (miles de millones de dólares) 



Producto 


b) 0.33, calculado por (63.7 + 36.6)/303.4 

c) 0.77, calculado por (63.7 + 36.6)7130.2 


Color 

Frecuencia 

Café 

130 

Amarillo 

98 

Rojo 

96 

Azul 

52 

Naranja 

35 

Verde 

33 


444 



51. 


345.3 - 125.0 
7 


31 .47 Utilice un intervalo de 35. 


Precio de venta 

f 

FC 

110 hasta 145 

3 

3 

145 hasta 180 

19 

22 

180 hasta 215 

31 

53 

215 hasta 250 

25 

78 

250 hasta 285 

14 

92 

285 hasta 320 

10 

102 

320 hasta 355 

3 

105 


a) La mayoría de las casas (53%) se encuentran en el rango de 
180 a 250. 

b) El valor más alto se encuentra cerca de 355; el más bajo, cerca 
de 110. 

c) 

120 

ÍS 100 

C/3 

S 80 

03 

^ 60 

O 

| 40 

z 20 
0 

110 145 180 215 250 285 320 355 

Precio de venta 


0.8 

0.6 

0.4 

0.2 


Alrededor de 42 casas se vendieron en menos de 200. 
Aproximadamente 55% de las casas se vendieron en menos de 
220, así que 45% se vendió en más. 

Menos de 1 % de las casas se vendió en menos de 125. 

d) 

Gráfica de barrios 

30 


25 


20 



1 2 3 4 5 


Barrio 


Los barrios 3 y 4 tienen más ventas que el promedio, y los 1 y 
5 estuvieron un poco abajo del promedio. 


803 


Porcentaje 





Frec. acum. 


53. Como 2 6 = 64 < 80 < 128 = 2 7 , utilice 7 clases. El intervalo debe 
ser por lo menos (1 008 - 741 )/7 = 38.14 millas. Utilice 40. La 
distribución de frecuencia resultante es: 


Clase 

f 

730 hasta 770 

5 

770 hasta 810 

17 

81 0 hasta 850 

37 

850 hasta 890 

18 

890 hasta 930 

1 

930 hasta 970 

0 

970 hasta 1 010 

2 


a) La cantidad típica de millas recorridas es 830. El rango es de 
730 hasta 1 010 millas. 

b) La distribución tiene forma de campana, alrededor de 830. Sin 
embargo, hay dos datos atípicos de hasta alrededor de 1 000 
millas. 

c) 

Frecuencia acumulativa de millas recorridas por mes 

80 
60 
40 
20 
0 

725 775 825 875 925 975 1 025 1 075 

Millas 

40% de los autobuses recorrieron menos de 820 millas. 

59 autobuses recorrieron menos de 850 millas. 


Gráfica de pastel por tipo de autobús 




Gráfica de pastel de número de asientos 



CAPITULO 3 


1. 

3. 

5. 

7. 


9. 


11 . 


13. 


|x = 5.4, calculado mediante 27/5. 

a) X = 7.0, calculado mediante 28/4 

b) (5 - 7) + (9 - 7) + (4 - 7) + (1 0 - 7) = 0 
X = 14.58, calculado mediante 43.74/3. 

a) 1 5.4, calculado mediante 1 54/1 0. 

b) Parámetro de la población, ya que incluye a todos los 
vendedores de Mldtown Ford. 

a) $54.55, calculado mediante $1 091/20. 

b) Una estadística muestral, suponiendo que la compañía de 
electricidad atienda a más de 20 clientes. 


X = 


2X , 

— asi que 


2X = X-n = ($5 430)(30) = $162 900 

300($ 20) + 400($25) + 400($23) 
300 + 400 + 400 


$22.91 , determinado por - 


15. $17.75, determinado por ($400 + $750 + $2 400)/200 
17. a) Sin moda 

b) El valor dado sería la moda 

c) 3 y 4 bimodal 
19. a) Media = 3.25 

ib) Mediana = 5 

c) Moda = 5 
21. a) Mediana = 2.9 
b) Moda = 2.9 
- 647 

23. X = — = 58.82 

Mediana = 58; moda = 58 

Cualquiera de las tres medidas sería satisfactoria. 

- 90.4 

25. a) X = = 7.53 

12 

b) Mediana = 7.45. Hay vahas modas: 6.5, 7.3 y 8.7 

- 33.8 

c) X = = 8.45, 

4 

Mediana = 8.7 

Alrededor de 1 punto porcentual más alto en Invierno 
27. 12.8 de incremento porcentual, determinado mediante 
^(1 ,08)(1 . 1 2)(1 . 1 4)(1 ,26)(1 . 05) = 1.128 
29. 12.28 de Incremento porcentual, determinado mediante 
^(1 ,094)(1 .1 38)(1 . 1 1 7)(1 .1 1 9)(1 . 1 47) = 1.1228 
/214 5 

31. 2.47%, calculado P or -W 172 2 ~~ 1 

„,/262 700 000 

33. 33.5%, calculado por ^ 340213 1 


35. a) 7, determinado mediante 10 - 3 

b) 6, determinado mediante 30/5 

c) 2.4, determinado mediante 12/5 

d) La diferencia entre el número más alto vendido (1 0) y el número 
más bajo vendido (3) es de 7. En promedio, el número de 
aparatos HDTV vendidos se desvía 2.4 de la media de 6. 

37. a) 30, determinado mediante 54 - 24 

b) 38, determinado mediante 380/1 0 

c) 7.2, determinado mediante 72/10 

d ) La diferencia entre 54 y 24 es de 30. En promedio el número de 
minutos que se requieren para instalar una puerta se desvía 7.2 
minutos de la media de 38 minutos. 


Estado 

Media 

Mediana 

Rango 

California 

33.10 

34.0 

32 

lowa 

24.50 

25.0 

19 


Las puntuaciones de la media y la mediana fueron más altas, pero 
había aún más variación en California. 
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La primera gráfica muestra que alrededor de dos tercios de los 
autobuses son dlésel. El segundo diagrama Indica que cerca 
de tres cuartos de los autobuses tienen 55 asientos. 


41. 


43. 


45. 


47. 


49. 


51. 


a) 5 

b) 4.4, determinado por 

(8 - 5) 2 + (3 - 5) 2 * + (7 - 5) 2 + (3 - 5) 2 + (4 - 5) 2 
5 

a) $2.77 

b ) 1 .26, determinado por 

(2.68 - 2.77 f + (1.03 - 2.77 f + (2.26 - 2.77 f 
+ (4.30 - 2.77 ) 2 + (3.58 - 2.77) 2 

5 


a) Rango: 7.3, determinado por 11.6-4.3. Media aritmética: 
6.94, determinada por 34.7/5. Varianza: 6.5944, determinada 
por 32.972/5. Desviación estándar: 2.568, determinada por 
V6.5944. 

b) Dennis tiene un rendimiento medio más alto (1 1 .76 > 6.94). No 
obstante, tiene una mayor dispersión en sus rendimientos 
sobre el capital (16.89 > 6.59). 

a) X = 4 


(7 — 4) 2 + ■ ■ ■ + (3 — 4) 2 


5 - 1 


22 

5 - 1 


5.5 


b) s = 2.3452 
a) X = 38 

2 _ (28 - 38) 2 


+ ■ • ■ + (42 - 38 f 


744 


10 - 1 
82.667 


82.667 


a) X = 


10 - 1 
b) s = 9.0921 
951 

lo" 

2 (101 - 95. 1) 2 + • 

S ” 10 
_ 1 112 .9 
9 

b) s = Vi 23.66 = 11.12 


95.1 


= 123.66 


■ + (88 - 95. 1) 2 
1 


53. Alrededor de 69%, determinado mediante 1 - 1/(1 .8) 2 
55. a) Aproximadamente 95%. 
b) 47.5%, 2.5%. 

57. Como en una distribución de frecuencias no se conocen los valores 
exactos, se utiliza el punto medio para cada miembro de dicha 
clase. 


Clase 

f 

M 


m 

(M — X) 

f(M - X) 2 

20 hasta 30 

7 

25 


175 

-22.29 

3 477.909 

30 hasta 40 

12 

35 


420 

-12.29 

1 812.529 

40 hasta 50 

21 

45 


945 

-2.29 

110.126 

50 hasta 60 

18 

55 


990 

7.71 

1 069.994 

60 hasta 70 

12 

65 


780 

17.71 

3 763.729 


70 



3 310 


10 234.287 

3310 _ 
70 

47.29 






/i 0 234.287 

12.18 




° 1 70 

1 




Número de clientes 

f 

M 

fM 

(M-X) 

f(M - X) 2 

20 a 30 


1 

25 

25 

-19.8 

392.04 

30 a 40 


15 

35 

525 

-9.8 

1 440.60 

40 a 50 


22 

45 

990 

0.2 

0.88 

50 a 60 


8 

55 

440 

10.2 

832.32 

60 a 70 


4 

65 

260 

20.2 

1 632.16 



50 


2 240 


4 298.00 


X = 


2 240 

50 

/ 4 298 

V 50-1 


44.8 


= 9.37 


63. 


65. 

67. 


69. 

71. 

73. 

75. 

77. 


79. 


81. 


83. 


85. 


a) 


b) 

X = 


Media = 5, determinada mediante (6 + 4 + 3 + 7 + 5)/5. 
La mediana es 5, calculada al volver a ordenar los valores y 
seleccionar el valor medio. 

Población, ya que se Incluyen todos los patrones. 


545 

16 


34.06 


Mediana = 37.50 

La media es 37.675, calculada por 1 427/40. 

La mediana es 35.675, calculada ordenando los datos y 
promediando las observaciones 20a. y 21a. 

c) 2(X — |ul) = (6 — 5) + (4 — 5) + (3 — 5) + (7 — 5) + 
(5 - 5) = 0 

$5.00(270) + $6.50(300) + £8.00 (1 00) 

270 + 300 + 100 




= $ 6.12 


[15 300(4.5) + 10 400(3.0) + 150 600(10.2)] 

“ Vü5o “ 928 


GM 


6 286 800 
5 1 64 900 


1 = 1.0094 - 1.0 = .0094 


a) 55, calculado mediante 72-17 

fj) 14.4, calculado mediante 144/10, donde X = 43.2 

c) 17.6245 

a) Ésta es una población, porque incluye a todas las 
universidades públicas de Ohio. 

b) La media es 22 163. 

c) La mediana es 18,989. 

d) El rango es 57 271. 

e) La desviación estándar es de 14,156. 

a) Se llevaron a cabo 13 vuelos; se consideran todos los 
elementos. 


b) 


c) 


a) 

b) 


c) 

a) 

b) 


c) 

a) 


2 259 
13 


173.77 


Mediana = 195 
Rango = 301 - 7 = 294 


133 846 
13 


101.47 


La media es $717.20, calculada por $17 930/25. La mediana es 
$717.00 y hay dos modas, $710 y 722. 

El rango es $90, calculado por $771 - $681 , y la desviación 
estándar es $24.87, calculada por la raíz cuadrada de 


1 4 850/24. 


De $667.46 hasta $766.94, calculado por $717.20 ± 2($24.87). 
La media es 0.8654, calculada por 17.309/2. La mediana es 
0.86, y la moda es 0.792. 

El rango es 0.269, calculado por 1 .025 - 0.756, y la desviación 
estándar es 0.0653, calculada por la raíz cuadrada de 
0.138167/19. 


Desde 0.6948 hasta 1 .036, calculado por 0.8654 ± 2(0.0853). 
- 273 

X = — — = 9.1, Mediana = 9 


b) 

c) 


Rang o = 18 - 4 = 14 


368.7 
30 - 1 


3.57 


2 5 = 32, de modo que se sugieren 5 clases. 
18-4 

i = — - — = 2.8 Use i = 3 

5 


Clase 

M 

f 

fM 

M- X 

(M - X) 2 

f(M - X) 2 

3.5 hasta 6.5 

5 

10 

50 

-4 

16 

160 

6.5 hasta 9.5 

8 

6 

48 

-1 

1 

6 

9.5 hasta 12.5 

11 

9 

99 

2 

4 

36 

12.5 hasta 15.5 

14 

4 

56 

5 

25 

100 

15.5 hasta 18.5 

17 

1 

17 

8 

64 

64 




270 



366 
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d) x = 


270 

30 


= 9.0 


19. 


a) La media es 30.8, calculada mediante 1 54/5. La mediana es 
31 .0, y la desviación estándar es 3.96, calculada mediante 


366 


= 3.552 


30-1 

La media y la desviación estándar de los datos agrupados son 
estimadores de la media de las desviaciones estándares de los 
valores reales. 

87. a) 1. El salario medio del equipo es $88 51 0 000, y la mediana es 
$80 350 000. 

Como la distribución está sesgada, el valor mediano de 
$80 350,000 es más típico. 

El rango es $1 64 700 000, calculado por 201 500 000 - 
36 800 000. La desviación estándar es $33 900 000. 
Alrededor de 95% de los salarios del equipo está entre 
$20 71 0,000 y $1 56 31 0 000, calculado por $88 51 0 000 
más o menos 2($33 900 000). 


= 3.96 


b) -0.15, calculado mediante 


c) 


3(30.8 - 31.0) 
3.96 



b) 9.65% por año, calculado por 


3 240 000 
512 930 


- 1 


36 

1.313131 

2.264250504 

26 

-1.212121 

-1.780894343 

33 

0.555556 

0.171467764 

28 

-0.707071 

-0.353499282 

31 

0.050505 

0.000128826 


0.301453469 


CAPITULO 4 

1. En un histograma las observaciones se encuentran agrupadas, así 
que pierden su identidad individual. Con un diagrama de puntos se 
conserva la identidad de cada observación. 


21. a) 


0.125, calculado mediante [5/(4 x 3)] x 0.301 
La media es de 21 .93, calculada por medio de 328.9/1 5. La 
mediana es de 15.8, y la desviación estándar de 21.18, 
calculada por medio de 


3. 

a) 

Diagrama de puntos. 

b) 

15 



c) 

1,7 

d) 

2 y 3 


5. 

a) 

De 620 a 629 

b) 

5 



c) 

621, 623, 623, 627, 629 


b ) 

7. 

a) 

25 

b ) 

Uno 

c) 


c) 

38 106 

d) 

60, 61, 63, 63, 65, 65, 69 

23. 


e) 

Sin valor 

f) 

9 



9) 

9 

h ) 

76 

7 


6 283 
14 


21.18 


0.868, calculado mediante [3(21.93 - 15.8)] 

2.444, calculado por [15/(14 x 13)] x 29.658 

Diagrama de dispersión de Ken función de X 


i) 16 


9. 


Tallo 

Hojas 

0 

5 

1 

28 

2 


3 

0024789 

4 

12366 

5 

2 


ii. 


13. 


15. 


17. 


Se estudiaron un total de 16 llamadas. El número de llamadas varió 
de 5 a 52. Siete de los 16 suscriptores hicieron entre 30 y 39 
llamadas. 

Mediana = 53, calculada mediante (1 1 + 1)(j) .-. 6o. valor a partir 
del más bajo. 

Q-, = 49, calculado mediante (1 1 + 1)(j) .-. 3er. valor a partir del 
más bajo. 

Q 3 = 55, calculado mediante (11+ IXl) 9o. valor a partir del más 
bajo. 

a) Qi = 33.25, 0 3 = 50.25 

b) D 2 = 27.8, D 8 = 52.6 
Per = 47 
350 

Qi = 175, Q 3 = 930 
930 - 175 = 755 
Menos de 0, o más de 2 060. 

No hay extremos. 

La distribución tiene un sesgo positivo. 



c) 

a) 

b) 

c) 

d) 

e) 

f) 


25. 


27. 


Existe una relación positiva entre las variables. 

a) Las dos variables están en escala nominal. 

b) Tabla de contingencias. 

c) Es dos veces más probable que los hombres ordenen un 
postre. Según la tabla, 32% de los hombres pidieron postre y 
sólo 15% de las mujeres lo hicieron. 

a) Diagrama de puntos. 

b) 15 

c) 5 


29. Tallo y hojas N = 23 


14.0 


21.0 


28.0 


+ - 

35.0 


49.0 


La distribución tiene un sesgo ligeramente positivo. Observe que la 
línea punteada sobre 35 es más larga que la que se encuentra 
debajo de 18. 


3 

3 

222 

3 

3 


5 

3 

77 

5 

3 


10 

4 

00000 

11 

4 

2 

11 

4 


(6) 

4 

666666 

6 

4 


6 

5 


6 

5 

222222 


31. a) L 50 — (20 + 1) 10 o : 

. . .. 83.7 H 

Mediana = 


= 10.50 
85.6 


= 84.65 
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4s = (21 )(.25) = 5.25 
Q-, = 66.6 + .25(72.9 - 66.6) = 68.175 
L 75 = 21 (.75) = 15.75 
Q 3 = 87.1 + .75(90.2 - 87.1) = 89.425 
b ) L 26 = 21 (.26) = 5.46 

P 26 = 66.6 + .46(72.9 - 66.6) = 69.498 

Lq^ = 21 (.83) = 17.43 

P 83 = 93.3 + .43(98.6 - 93.3) 

= 95.579 

c) 


■I 


I- 


+ + + + + C20 

64.0 72.0 80.0 88.0 96.0 

33. a) Q-! = 26.25, Q 3 = 35.75, Mediana = 31 .50 

1 i I 


+ + + + + + 

24.5 28.0 31.5 35.0 38.5 42.0 

b) = 33.25, Q 3 = 38.75, Mediana = 37.50 


I 


+ 


I 


+ + + + + + 

32.5 35.0 37.5 40.0 42.5 45.0 

c) El tiempo mediano para el transporte público es de casi 6 
minutos menos. Hay mayor variación en el transporte público. 
La diferencia entre Q-, y Q 3 es de 9.5 minutos en el caso del 
transporte público y de 5.5 minutos en el del transporte 
privado. 

35. La distribución tiene un sesgo positivo. El primer cuartil es de 
aproximadamente $20 y el tercero de alrededor de $90. Hay un 
extremo localizado en $255. La mediana es de $50 más o menos. 

37. a) 


c) 

Diagrama de dispersión del precio en función del tamaño 



Existe una relación directa entre ellas. La primera observación 
es más grande en ambas escalas. 


Forma/ 

corte 

Promedio 

Bueno 

Ideal 

De alta 
calidad 

Ultra 

ideal Todos 

Esmeralda 

0 

0 

1 

0 

0 

1 

Marquesa 

0 

2 

0 

1 

0 

3 

Oval 

0 

0 

0 

1 

0 

1 

Princesa 

1 

0 

2 

2 

0 

5 

Redondo 

1 

3 

3 

13 

3 

23 

Total 

2 

5 

6 

17 

3 

33 


La mayoría de los diamantes son redondos (23). El corte de alta 
calidad es el más común (17). La combinación redondo de alta 
calidad se presenta con mayor frecuencia (13). 

3(7.7143 - 8.0) 


39. sk = 0.065 o sk 


3.9036 


-0.22 


41 . 

Diagrama de dispersión de accidentes en función de la edad 


Diagrama de caja del precio 


0 10 000 20 000 30 000 40 000 50 000 

Precio 

La mediana es de 3,373. El primer cuartil es de 1 478. El tercer 
cuartil es de 6 141 . Así que los precios sobre 13 135.5, calculados 
mediante 6 141 + 1.5 (6 141 - 1 478), son extremos. Hay tres 
(13 925; 20 41 3 y 44 31 2). 

b) 





Gráfica de caja del tamaño 

* * 

* 

1 

0 


1 

1 

1 i i 

2 3 4 

Tamaño 

1 

5 


La mediana es de 0.84. El primer cuartil es de 0.51 5. El tercer 
cuartil es 1 .1 2. Así que los tamaños por encima de 2.0275, que se 
calcula mediante 1.12 + 1 .5 (1.12 - 0.515), son extremos. Hay tres 
(2.03, 2.35 y 5.03). 


5 
4 

t/3 
<D 

c 3 

<x> 

■O 

o 2 
o *- 
< 

1 

o 

15.0 17.5 20.0 22.5 25.0 27.5 30.0 32.5 
Edad 



43 . 


45 . 


Conforme la edad aumenta, el número de accidentes se reduce, 
a) 139 340 000 

ib) 5.4% desempleados, determinados por (7 523/139 340)100 

c) Hombres = 5.64% 

d) Mujeres = 5.12% 

a) 


Diagrama de caja de la edad 


H 


0 20 40 60 80 100 

Edad 


Hay cinco datos atípicos. Hay un grupo de tres de alrededor de 40 
años (Angels, Athletics y Dodgers) y un grupo de dos cercanos a 
cien años de edad (Cachorros y Medias Rojas). 
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Diagran 

ia de caja de salario 



O 

LO 

1 1 

75 100 

iiii 

125 150 175 200 

Salario 


El primer cuartil es de $66 650 000, y el tercero de 15. 

$1 05 500 000. La distribución tiene un sesgo positivo, con los 17. 

Yanquis de Nueva York como un dato atípico definitivo. 


a) Las respuestas variarán. He aquí algunas posibilidades: 123, 
124, 125, 999. 

b) (1/1 0) 3 

c) Clásico 

P(A o B) = P(A) + P(B) = .30 + .20 = .50 
P(ninguna) = 1 - .50 = .50. 

a) 102/200 = .51 

b) 0.49, calculado mediante 61/200 + 37/200 = .305 + .185. 
Regla especial de la adición. 

P(sobre C) = .25 + .50 = .75 
P[A o S) = P(A) + P(B) - P(A y B) 

= .20 + .30 - .15 = .35 


c) 


Diagrama de dispersión de victorias i/s. salario 



d) 

Diagrama de puntos de las victorias 


19. Cuando dos eventos son mutuamente excluyentes, si uno ocurre, el 
otro no puede ocurrir. Por lo tanto, la probabilidad de que se 
presenten de manera conjunta es cero. 

21. a) P(P y P) = 0.20 

b) P(P y D) = 0.30 

c) No 

d ) Probabilidad conjunta 

e) P(P o D o F) = 1 - P(P y D y F) 

= 1 - .10 = .90 

23. P(A y B) = P(A) X P(B\A) = .40 X .30 = .12 
25. 0.90, determinado mediante (.80 + .60) - .5. 

0.10, determinado mediante (1 - .90). 

27. a) P(A-¡) = 3/10 = .30 

b) P(Bi\A 2 ) = 1/3 = .33 

c) P(B 2 yA 3 ) = 1/10 = .10 
29. a) Tabla de contingencias. 

b) 0.27, calculado mediante 300/500 x 135/300 

c) El diagrama de árbol sería el siguiente: 




60 66 72 78 84 90 96 102 

Victorias 

La distribución es casi uniforme entre 59 y 103. 


CAPÍTULO 5 



Persona 

Resultado 

1 2 

1 

A A 

2 

A F 

3 

F A 

4 

F F 


6 

3. a) .176, calculado con — b) Empírico 

5. a) Empírico 

b) Clásico 

c) Clásico 

d) Empírico, basado en los datos sismológicos. 

7. a) La encuesta entre 40 personas sobre los problemas del medio 
ambiente. 

f>) 26 o más respondieron que sí, por ejemplo. 

c) 1 0/40 = 0.25 

d) Empírico 

e) Los eventos no son iguales, pero son mutuamente 
excluyentes. 


Aceptable 


Excelente 

Aceptable 



(50/500) (16/50) 
(50/500) (12/50) 
(50/500) (22/50) 


(150/500) (45/150) 
(150/500) (60/150) 
(150/500) (45/150) 

(300/500) (93/300) 
(300/500) (72/300) 


= .032 
= .024 
= .044 

= .090 
= .120 
= .090 

= .186 
= .144 


Excelente 


(300/500) (1 35/300) =.270 
Total 1.000 


31. Probabilidad de ganar en la primera presentación = 3/5 = .60 
Probabilidad de ganar en la segunda presentación 
= (2/5)(3/4) = .30 

Probabilidad de ganar en la tercera presentación 
= (2/5)(1/4)(3/3) = .10 

P(A : ) X P(B, \A : ) 


33. P(A-,\Bi) = 


35. P(noche | ganar) 


P(Ai) x P(B, \A,) + P(A 2 ) X P(B, \A 2 ) 

.60 x ,05 _ 

(.60 X .05) + (.40 X .10) ~ ' 

P(noche)P(ganar | noche ) 


P(noche)P(ganar|noche) + P(día)P(ganar|día) 
(-70K.50) 


[(■70)(.50)j + [(.30)(.90)] 


= .5645 
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37. 


39. 


41. 

43. 

45. 

47. 


49. 

51. 


53. 


55. 


P(efectivo o cheque | > $50) 

_ P(efectivo o cheque P(> $50 1 efectivo o cheque) 

P(efectivo o cheque P(> $50 1 efectivo o cheque) 

+ P(crédito) P(> $50 1 crédito) 

+ P(débito)P(> $50 1 débito) 

= = .1053 

(,30)(.20) + (,30)(.90) + (,40)(.60) 

a) 78 960 960 

ib) 840, calculado según (7)(6)(5)(4). Es decir, 7!/3! 
c) 10, calculado según 5!/3!2! 

210, calculado con (1 0)(9)(8)(7)/(4)(3)(2) 

120, calculado mediante 5! 

10 879 286 400, determinado con 
15 P 10 = (1 5)(1 4)(1 3)(1 2)(1 1 )(1 0)(9)(8)(7)(6) 

a) Pedir a los adolescentes que comparen sus reacciones ante un 
refresco recién creado. 

b) Las respuestas vaharán. Una posibilidad consiste en que a 
más de la mitad de los entrevistados les guste. 

Subjetivo. 

a) 4/9, calculado por (2/3) • (2/3). 

b) 3/4, porque (3/4)- (2/3) = 0.5. 

a) 0.8145, calculado mediante (,95) 4 

b) Regla especial de la multiplicación. 

c) P(A y B y C y D) = P(A) x P(B) X P(C) X P(D) 

a) 0.08, calculado mediante .80 x .10 

b) No; 90% de las mujeres asistió a la universidad; 78% de los 
hombres. 


71 . P(pobre | ganancia) 


, 10 (. 20 ) 


,60(.80) + ,30(.60) 


73. 


75. 

77. 

79. 

81. 


83. 

85. 

87. 


a) 

b) 

c) 

d) 


. 1 0 (. 20 ) 

.0294 

P(P o D) = (1/50)(9/10) + (49/50)(1/1 0) = 0.116 
P(No) = (49/50)(9/1 0) = 0.882 
P(no sobre 3) = (0.882) 3 = 0.686 
P(por lo menos un premio = 1 - 0.686 = 0.314 
Sí; 256 se calcula mediante 2 8 . 

0.9744, calculado mediante 1 - (.40) 4 

a) 0.185, calculado mediante (.1 5)(.95) + (.05)(.85) 

ib) 0.0075, calculado mediante (. 1 5)(.05) 

a) P(F y >60) = .25 y, determinado con la regla general de la 
multiplicación: 

P(F)-P(>60|F) = (.5)(.5) 

b) 0 

c) 0.3333, calculado con 1/3 
26 4 = 456 976 

1/3, 628 800 

a) P(D) = ,20(.03) + ,30(.04) + .25(.07) + ,25(.065) 

= .05175 

,20(.03) 


b) P(Tyson| defectuoso) 


.20(.03) + ,30(.04) 

F ,25(.07) + .25(.065) 


= .1159 


Género 



Asistió a la En conjunto 
universidad .80 x .90= .720 

No 

asistió .80 X .10 = .080 
Asistió .20 X .78 = .156 


No 

asistió .20 x .22 = 
Total 


Proveedor 

Conjunta 

Revisada 

Tyson 

.00600 

.1159 

Fuji 

.01200 

.2319 

Kirkpatricks 

.01750 

.3382 

Parts 

.01625 

.3140 


.05175 

1.0000 


89. 

91. 


0.512, calculado por (0.8) 3 
0.525, calculado por 1 - (0.78) 3 

a) 


d) Sí, ya que todos los resultados posit 
diagrama de árbol. 

57. a) 0.57, calculado con 57/100 

b) 0.97, calculado con (57/100) + (40/100) 

c) Sí, ya que un empleado no puede ser las dos cosas. 

d) 0.03, calculado con 1 - 0.97 
59. a) 1/2, calculado por (2/3)(3/4) 

b) 1/12, calculado por (1/3)(1/4) 

c) 1 1/12, calculado por 1 - 1/12 
61. a) 0.9039, calculado con (0.98) 5 

b) 0.0961 , calculado con 1 - 0.9039 
63. a) 0.0333, calculado con (4/1 0)(3/9)(2/8) 

b) 0.1 667, calculado con (6/1 0)(5/9)(4/8) 

c) 0,8333, calculado con 1 - 0.1667 

d) Dependiente 

65. a) 0.3818, calculado mediante (9/1 2)(8/11)(7/10) 
b) 0.6182, calculado mediante 1 -0.3818 
67. a) P(S) • P(R|S) = .60(.85) = 0.51 

b) P(S) • P(PR|S) = .60(1 - .85) = 0.09 
69. a) P(no perfecto) = P(sector malo) + P(defectuoso) 

112 31 

— -F — .143 

1 000 1 000 



Temporada 


Asistencia 




Baja 

Media 

Alta 

Total 

de victorias 

.044 

No 

9 

3 

2 

14 


Sí 

2 

7 

7 

16 

1.000 


— 

— 

- 

— 

Total 

11 

10 

9 

30 


1 . 0.5333, calculado por 16/30 

2. 0.6000, calculado por 16/30 + 9/30 ■ 

3. 0.7778, calculado por 7/9 

4. 0.0667, calculado por 2/30 


7/30 = 1 8/30 


b ) 



Temporada Temporada 
de derrotas de victorias 

Total 

Nueva 

8 

8 

16 

Antigua 

6 

8 

14 

Total 

14 

16 

30 


1. 0.53330, calculado por 16/30 

2. 0.2667, calculado por 8/30 

3. 0.8000, calculado por 16/30 + 16/30 - 8/30 


b) P(defectuoso/no perfecto) 


.031 

.143 


= .217 
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CAPÍTULO 6 

1. Media = 1.3, varianza = 0.81, calculadas según: 

(JL = 0(.20) + 1 (.40) + 2(.30) + 3(. 1 0) = 1.3 
o- 2 = (0 - 1 ,3) 2 (.2) + (1 - 1 ,3) 2 (.4) 

+ (2 - 1.3) 2 (.3) + (3 - 1.3) 2 (.1) 

= .81 

3. Media = 14.5, varianza = 27.25, calculadas por: 
(JL = 5(.1) + 1 0(.3) + 1 5(.2) + 20(.4) = 14.5 

o- 2 = (5 - 14.5) 2 (.1) + (10 - 14.5) 2 (.3) 

+ (15 - 14.5) 2 (.2) + (20 - 14.5) 2 (.4) 

= 27.25 


Llamadas, 

X 

Frecuencia 


XP ( X ) 

( X - | J.) 2 

m 

0 

8 

.16 

0 

.4624 

1 

10 

.20 

.20 

.0980 

2 

22 

.44 

.88 

.0396 

3 

9 

.18 

.54 

.3042 

4 

1 

.02 

.08 

.1058 


50 


1.70 

1.0100 


b) Distribución discreta, ya que sólo son posibles ciertos 
resultados. 


c) (jl = £x • P(x) = 1 .70 

d) a = VTVT = 1.005 


Cantidad 

PM 

XP ( X ) 

(X-fJL ) 2 P(X) 

10 

.50 

5 

60.50 

25 

.40 

10 

6.40 

50 

.08 

4 

67.28 

100 

.02 

2 

124.82 



21 

259.00 


a) jjl = XxP(x) = 21 

b) <t 2 = 2(x - M .) 2 P(x) = 259 
ir ■■ V259 = 16.093 

9 - a) P(2) = 2 , (4 4 í 2) , (.25) 2 (.75) 4 - 2 = .2109 
b ) P( 3) = 3!(4 4 i 3)| (.25) 3 (.75) 4 3 = .0469 


X 

m 

0 

.064 

1 

.288 

2 

.432 

3 

.216 


b) jjl = 1 .8 
o- 2 = 0.72 

<t = V(X72 = .8485 

13. a) .2668, calculado con P( 2) = — ^ 2 y 2] (.3) 2 (.7) 7 

b) .1715, calculado con P(4) = — — (,3) 4 (.7) 5 

c) .0404, calculado con P(0) = — — (,3)°(.7) 9 

101 

15. a) .2824, calculado con P( 0) = _ Q (.10)°(.9) 12 

121 

b) .3765, calculado con P( 1) = — — (.lO) 1 ^) 11 

w (12 - 1 )! 1 ! v ' v ' 
12! 

c) .2301, calculado con P( 2) = _ g (.10) 2 (.9) 10 

d) (j, = 1.2, calculado con 12(. 10) 

cr = 1 .0392, calculado con Vi. 08 


17. a) 0.1858, calculado con (0.23) 2 (0.77) 13 

b) 0.1416, calculado con (0.23) 5 (0.77) 10 

c) 3.45, calculado con (0.23)(1 5) 

19. a) 0.296, determinado utilizando el apéndice B. 9, con n de 8; ir 
de 0.30 yxde 2. 

b) P(x < 2) = 0.058 + 0.198 + 0.296 = 0.552 

c) 0.448, determinado con P(x > 3) = 1 - P(x a 2) = 1 - 0.552 
21. a) 0.387, determinado utilizando el apéndice B. 9, con n de 9; ir 

de 0.90 y x de 9. 

b) P(X < 5) = 0.001 

c) 0.992, determinado con 1 - 0.008 

d) 0.947, determinado con 1 - 0.053 

23. a) (jl = 10.5, determinado con 15(0.7) y <r = Vl5(0.7)(0.3) = 

1 .7748 

íj) 0.2061 , determinado con (0.7) 10 (0.3) 5 


25. 

27. 

29. 

31. 

33. 

35. 


c) 0.4247, determinado con 0.2061 + 0.2186 

d) 0.5154, determinado con 

0.2186 + 0.1700 + 0.0916 + 0.0305 + 0.0047 

UCdLVi] _ ^5(4) 


P(2) — 

P(0) = 

P(2) = 

a) 0.6703 

b) 0.3297 

a) 0.0613 

b) 0.0803 

(JL — 6 


10Ql 

120 

[7^] [3^] 

21(1) 

[l0^2] 

45 

[9^3] [eC 2 ] 

84(15) 

[15C5] 

3 003 


.50 


= .4667 


= .4196 


P(X> 5) = 1 - (.0025 + .0149 + .0446 + .0892 + .1339) 

= .7149 

37. Una variable aleatoria es un resultado cuantitativo o cualitativo que 
se deriva de un experimento aleatorio. Una distribución de 
probabilidad también incluye la posibilidad de cada posible 
resultado. 

39. (jl ~ $1 000(.25) + $2 000(.60) + $5 000(.15) = $2 200 
<r 2 = (1 000 - 2 200) 2 .25 + ($2 000 - $2 200) 2 .60 + 

(5 000 — 2 200) 2 .15 
= 1 560 000 

41. (jl = 12(.25) + • ■ ■ + 1 5(.1) = 13.2 

<t 2 = (12 - 13.2) 2 .25 + ■ • ■ + (15 - 13.2) 2 .10 = 0.86 
<r = Vo86 = .927 
43. a) (jl = 1 0(.35) = 3.5 

b) P (X = 4) = 10 C 4 (,35) 4 (,65) 6 = 210(.0150) (.0754) = .2375 

c) P(X>4) = 10 C x (.35)*(.65r-* 

= .2375 + .1536 + • ■ ■ + .0000 = .4862 
6, calculado por 0.4 x 15 

0.0245, calculado por (0.4) 10 (0.6) 5 


45. 


a) 

b) 

c) 

d) 


47. 


1015! 

0.0338, calculado por 

0.0245 + 0.0074 + 0.0016 + 0.0003 + 0.0000 
0.0093, calculado por 0.0338 - 0.0245 
a) (jl = 20(0.075) = 1 .5 

a = V20(0.075)(0.925) = 1.1779 
20 > 

0.2103, determinado por _ (0.075)°(0.925) 2C 


49. 


b) 

c) 

a) 

b) 

c) 


51. P( 2) = 


0120! 

0.7897, determinado por 1 - 0.2103 

0.1311, calculado por^j^y (0.15) 4 (0.85) 12 

2.4, determinado por (0.15)(16) 

0.2100, determinado por 
1 - 0.0743 - 0.2097 - 0.2775 - 0.2285 
[ 6 C 2 ][ 4 C 2 ] _ (1 5)(6) 


[10C4] 


210 


0.4286 
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53. a) 


0 

0.0002 

7 

0.2075 

1 

0.0019 

8 

0.1405 

2 

0.0116 

9 

0.0676 

3 

0.0418 

10 

0.0220 

4 

0.1020 

11 

0.0043 

5 

0.1768 

12 

0.0004 

6 

0.2234 




b) 

c) 

d) 


55. a) P( 1) 

b) P(0) 


(jl = 12(0.52) = 6.24 

ir = Vl2(0.52)(0.48) = 1.7307 

0.1768 

0.3343, calculado por 0.0002 + 0.0019 
+ 0.0116 + 0.0418 + 0.1020 + 0.1768 
[rCdLA] _ (2 1 )(3) 


57. 

59. 

61. 


P(X = 0) 


[ 10 Q 3 ] 

120 

[ 7 Q 3 ] [ 3 ^ 0 ] 

(35)(1 ) 

[l0Q3] 

120 

1) = 1 - P( 0) = 1 - 

LAILA] 

70 

[ 12 CJ 

495 


= .5250 

= .2917 
- .2917 = 
= .141 


.7083 


63. 


65. 


a) 0.0498 

b) 0.7746, determinado por (1 - .0498) 5 
(i = 4.0 del apéndice B.5 

a) 0.0183 

b) 0.1954 

c) 0.6289 

d) 0.5665 

(S.l^e -3 - 1 

a) 0.1733, determinado por — 

(S.lV’e -3 ' 1 

b) 0.0450, determinado por — 

c) 0.9550, determinado por 1 - 0.0450 
2 


(ji = mi = 23 
P(2) 


113 

(,407) 2 e “ 407 


P(0) 


2! 

(.407)° e~ 407 
0! 


= .407 


= 0.0551 


= 0.6656 


67. Sea (X = nir = 1 55(1 /3 709) = 0.042 


P(5) : 


0.042 5 e~ 


5! 


= 0.000000001 


¡Muy poco probable! 

69. a) (ji = nir = 15(.67) = 10.05 

ir = Vmr(1 - ir) = Vl5(.67)(.33) = 1.8211 

b) P( 8) = 15 C 8 (.67) 8 (.33) 7 = 6 435(.0406)(.000426) = .1114 

c) P(x> 8) = .1114 + .1759 + ■ ••+ .0025 = .9163 
El número medio de cuadrangulares por partido es 2.0749, 
determinado por 5 042/(15 x 162). 

2.0749° e~ 2 ' 0749 
a) P(0) = - 


71. 


b) P( 2) 


0! 

2.0749 2 e“ 


2! 


= 0.1257 


= 0.2703 


c) P(X >= 4) = 0.1566, calculado po 1 - (0.1257 + 0.2605 
+ 0.2703 + 0.1869) 


CAPITULO 7 


a) 

b) 


10, a = 6 
6 + 10 


c) ir 

d) Área = 


(10 - 6) 2 


12 

1 


= 1.1547 
(10 - 6 ) 


(10 - 6 ) 1 


= 1 


e) P(X > 7) j 


1 


10-7 


( 10 - 6 ) 1 


= .75 


f ) P( 7 < x < 9) = 


1 


(9 ^ ) = 2 = .50 

(10 - 6) 1 4 


3. a) 0.30, calculado por (30 - 27)/(30 - 20) 
b) 0.40, calculado por (24 - 20)/(30 - 20) 

5. a) a = 0.5, b = 3.00 

to) (jl = 0,5 + o 3Q ° = 1 .75 


(3.00 - ,50) 2 


12 


= .72 


c) P(x < 1) 

d) 0, calculado por 


1 - .5 


.5 


= 0.2 


e) P(x >1.5) 


(3.0 - 0.5) 1 2.5 

1 ( 1 . 0 - 1 . 0 ) 
(3.0 - 0.5) 1 

1 3.0 - 1.5 _ 1.5 

(3.0 - 0.5) 1 “ Z5 


= 0.6 


7. La forma real de una distribución normal depende de su media y de 
su desviación estándar. Por lo tanto, existe una distribución normal 
y una curva normal que la acompaña para una media de 7 y una 
desviación estándar de 2. Hay otra curva normal para una media de 
$25 000 y una desviación estándar de $1 742, etcétera. 


9. a) 490 y 51 0, determinado por 500 

b) 480 y 520, determinado por 500 

c) 470 y 530, determinado por 500 


11 - Z Rob — 


$50 000 - $60 000 
$5 000 

$50 000 - $35 000 
$8 000 


-2 

1.875 


1 ( 10 ) 

2 ( 10 ) 

3(10) 


Con el ajuste correspondiente a sus industrias, Rob está muy por 
debajo del promedio y Rachel muy por encima. 


13. a) 

b) 

c) 

15. a) 

b) 

c) 

17. a) 


b) 

o) 

19. a) 

b) 

c) 


25 - 20 

1.25, determinado porz = — — — = 1.25 
H 4.0 

0.3944, localizado en el apéndice B.1 
18 - 20 

0.3085, determinado porz = — — — — = -0.5 


Encuentre 0.1915 en al apéndice B.1 paraz = -0.5, 
después 0.5000 - 0.1915 = 0.3085 


0.3413, determinado porz = 


$24 - $20.50 
$3.50 


1 . 00 , 


en seguida encuentre 0.3413 en al apéndice B.1 paraz = 1 
0.1587, determinado por 0.5000 - 0.3413 = 0.1587 
$19.00 - $20.50 

0.3336, determinado porz = — — = “O- 43 

$3.50 


Encuentre 0.1664 en el apéndice B.1, paraz = -0.43, después 
0.5000 - 0.1664 = 0.3336 

0.8267: primero encuentre z = -1.5, calculado según (44 - 
50)/4 y z = 1 .25 = (55 - 50)/4. El área entre -1 .5 y 0 es 
0.4232, y el área entre 0 y 1 .25 es 0.3944, las dos de acuerdo 
con el apéndice B.1 . En seguida, al sumar las dos áreas, 
encuentra que 0.4332 + 0.3944 = 0.8276. 

0.1056, determinado por 0.5000 - .3944, donde z = 1.25. 
0.2029: recuerde que el área paraz = 1 .25 es 0.3944, y el área 
paraz = 0.5, calculada mediante (52 - 50)/4, es de 0.1915. 

En seguida reste 0.3944 - 0.1915 para determinar 0.2029. 
0.3264, calculado por 0.5000 - 0.1736, donde z = 0.45, 
calculado por [(3 000 - 2 708)/650] 

0.2152; el valor z para $3 500 es 1.22, calculado por [(3 500 - 
2 708)/650] y el área correspondiente es de 0.3888, lo que nos 
lleva a 0.3888 - 0.1736 = 0.2152. 

0.5413; el valor z de $2 500 es 1.22, calculado por [(2 500 - 
2 708)/650], y el área correspondiente es 0.1255, lo que nos 
lleva a 0.1255 + 0.3888 = 0.5143. 


811 


21 . 


23 . 


25 . 

27 . 


29 . 

31 . 


33 . 


35 . 


37 . 


39 . 


41 . 


a) 0.0764, calculado con z = (20 - 15)/3.5 = 1 .43 en seguida 
0.5000 - 0.4236 = 0.0764 

b) 0.9236, calculado según 0.5000 + 0.4236, donde z = 1 .43 

c) 0.1185, calculado con z = (12 - 15)/3.5 = -0.86. 

El área bajo la curva es de 0.3051 ; entonces z = (1 0 - 1 5)/3.5 
= -1.43. El área es 0.4236. Finalmente, 0.4236 - 0.3051 = 
0.1185. 

X = 56.60, que se calcula sumando 0.5000 (el área a la Izquierda de 
la media), y en seguida se determina un valor z que obliga a que 
45% de los datos queden dentro de la curva. Al despejar X: 1 .65 = 
(X - 50)/4 = 56.60. 

$1 630, que se determina mediante $2 100 - 1 ,88($250) 

a) 214.8 horas: se determina un valorz para el que 0.4900 del 
área se localice entre 0 yz. Dicho valor esz = 2.33. En seguida 
se despeja X: 2.33 = (X - 195)/8.5,; así queX = 214.8 horas. 

b) 270.2 horas: se determina un valorz para el que 0.4900 del 
área se localice entre 0 y (-z). Dicho valor es z = -2.33. 

En seguida se despeja X: -2.33 = (X - 290)/8.5; así que X = 
270.2 horas. 

41.7%, calculado por 12 + 1.65(18) 

a) |X = rnr = 50(0.25) = 12.5 

o- 2 = mr(1 - ir) = 12.5(1 - 0.25) = 9.375 

cr = V9.375 = 3.0619 

b) 0.2578, determinado por (14.5 - 12.5)/3.0619 = 0.65. El área 
es 0.2422. Entonces 0.5000 - 0.2422 = 0.2578. 

c) 0.2578, determinado por (10.5 - 12.5)/3.0619 = -0.65. El 
área es 0.2422. Entonces 0.5000 - 0.2422 = 0.2578. 

a) (jl — nir — 80(0.07) — 5.6 
<r = V5.208 = 2.2821 

0.3483, determinado porz = (6.5 - 5.6)/2.2821 = 0.39 con el 
área correspondiente de 0.1517, entonces 0.5000 - 0.1517 = 
0.3483. 

íj) 0.5160, calculado por z = (5.5 - 5.6)/2.2821 = - 0.04 con el 
área correspondiente de 0.0160, entonces 0.5000 
+ 0.0160 = 0.5160 

c) 0.1677, calculado por .5160 - 0.3483. 

a) Sí 1). Hay dos resultados mutuamente excluyentes: sobrepeso 
y no sobrepeso. 2) El resultado de contar el número de éxitos 
(miembros con sobrepeso). 3) Cada prueba es independiente. 

4) La probabilidad de 0.30 sigue siendo igual en cada prueba. 

b) 0.0084, calculado por 
|jl = 500(0.30) = 150 

o- 2 = 500(.30)(.70) = 105 

(j = Vl05 = 10.24695 

X - jjl 174.5 - 150 

z = = = 2.39 

cr 10.24695 

El área bajo la curva para z =2.39 es 0.491 6. 

Entonces 0.5000 - 0.4916 = 0.0084. 

139.5 - 150 

c) 0.8461 , calculado mediante z = = - 1 .02 

10.24695 


El área entre 139.5 y 150 es 0.3461. 

Sumando, 0.3461 + 0.5000 = 0.8461. 

a) 0.3935, calculado por 1 - e [( ^ 1/60)(30)I 

b) 0.1353, calculado por e [( ~ 1/60) <120)1 

c) 0.1 859, calculado por e»- 1 / 60 » « 45 « - e^ 1 / 60 » < 75 >1 

d) 41.59 segundos, determinado por -60 ln(0.5) 

a) 0.5654, determinado por 1 - e [( ~ 1/18)( i 5)1 y 0.2212, 
determinado por 1 - e [< ~ 1/60)(15)1 

b) 0.0013, calculado por e [( ~ 1/18) (120)1 y 0.1353, calculado por 

g[{- 1/60) (120)] 

c) 0.1821, calculado por e [( “ 1/18)(30)I - e [( “ 1/18)(90)! y 0.3834, 
calculado por eK- 1 / 60 ' < 30 >1 - e»- 1 / 60 » < 90 » 

d ) 4 minutos, determinado por -18 ln(0. 8) y 13.4 minutos, 
determinado por -60 ln(0.8) 

, 11.96 + 12.05 

a) (jl = = 12.005 


b) 


(12.05 - 11. 96) 2 


12 


= .0260 


1 


C) P(X< 12)= (12.05-11.96) 
d) P(X> 11 .98) 


12.00-11.96 .04 


1 .09 

( 12.05 - 11.98 


- = .44 


(12.05 - 11.96) \ 

S-™ 


43 . 


45 . 


47 . 


49 . 


51 . 


53 . 

55 . 


57 . 


e) 

a) 

b) 

c) 

d ) 


Todas las latas pueden tener más de 1 1 .00 onzas, así que la 
probabilidad es de 100%. 


4 + 10 

F = ^^ = 7 

(10 - 4) 2 
12 


= 1 


P(X < 6) = 
P(X > 5) = 


1 


(10-4) 

1 

(10 - 4) 


.732 






a) -0.4 de las ventas netas, calculado según (170 - 180)/25. 
2.92 de los empleados, determinado por (1 850 - 1 500)/120. 

b) Las ventas netas se encuentran a 0.4 desviaciones estándares 
por debajo de la media. Los empleados se encuentran a 2.92 
desviaciones estándares sobre la media. 

c) 65.64% de los fabricantes de aluminio tienen ventas netas más 
altas en comparación con Clarion, calculadas de acuerdo con 
0.1554 + 0.5000. Sólo 0.18% tienen más empleados que 
Clarion, calculados según 0.5000 - 0.4982. 

30 - 490 

a) 0.5000, ya que z = — =-5.11 

b) 0.2514, calculado por 0.5000 - 0.2486 

c) 0.6374, calculado por 0.2486 + 0.3888 

d) 0.3450, calculado por 0.3888 - 0.0438 

a) 0.3015, calculado por 0.5000 - 0.1985 

b) 0.2579, calculado por 0.4564 - 0.1985 

c) 0.001 1 , calculado por 0.5000 - 0.4989 

d) 1818, calculado por 1 280 + 1 .28(420) 

a) 90.82%: primero se determina z = 1.33 mediante (40- 
34J/4.5. El área entre 0 y 1.33 es 0.4082. En seguida sume 
0.5000 y 0.2823 y encuentre 0.9082 o 90.82%. 

b) 78.23%: primero se determina z = -0.78 mediante (25 - 
29)/5.1. El área entre 0 y (-0.78) es 0.2823. En seguida sume 
0.5000 y 0.2823 y encuentre 0.7823 o 78.23%. 

c) 44.5 horas/semana para las mujeres: se determina un valorz 
para el que 0.4900 del área se encuentra entre 0 y z. El valor 
es 2.33. En seguida se despeja X: 2.33 = (X - 34)/4.5, así que 
X = 44.5 horas/semana. 40.9 horas/semana en el caso de los 
hombres: 2.33 = (X - 29)/5.1, así queX = 40.9 horas/semana. 

Alrededor de 4 900 unidades, calculadas al despejar X. 

1 .65 = (X - 4 000)/60 

a) 15.39%, calculado por (8 - 10.3)/2.25 = -1.02, 
then 0.5000 - 0.3461 = 0.1539. 

b) 17.31%, calculado por: 

z = (12 - 1 0.3)/2.25 = 0.76. El área es de 0.2764. 

z = (14 - 1 0.3)/2.25 = 1.64. El área es de 0.4495. 

El área entre 12 y 14 es de 0.1731, determinado por 0.4495 - 
0.2764. 

c) Sí, pero es más bien remota. Razonando: en 99.73% de los 
días, las devoluciones son entre 3.55 y 17.05, calculadas 
mediante 10.3 ± 3(2.25). Por consiguiente, la probabilidad de 
menos de 3.55 devoluciones es más bien remota. 

a) 0.9678, calculado por: 

(jl = 60(0.64) = 38.4 

o- 2 = 60(0.64)(0.36) = 13.824 
<r = Vi 3.824 = 3.72 

Entonces, (31 .5 - 38.4)/3.72 = -1 .85, para el cual el área es 
de 0.4678. 

Así, 0.5000 + 0.4678 = 0.9678. 

b) 0.0853, calculado por (43.5 - 38.4)/3.72 = 1 .37, donde el área 
es de 0.4147. Entonces, 0.5000 - 0.4147 = .0853. 

c) 0.8084, calculado por 0.4441 + 0.3643 

d) 0.0348, calculado por 0.4495 - 0.4147 


812 


59. a) 0.0968, determinado mediante 
|jl = 50(0.40) = 20 
o- 2 = 50(0.40)(0.60) = 12 

cr = VÍ2 = 3.46 
z = (24.5 - 20)/3.46 = 1.30. 

El área es 0.4032. Entonces, para 25 o más, 0.5000 - 0.4032 = 
0.0968. 


61. 


63. 


65. 


67. 

69. 


71. 


73. 


75. 


a) 1 .65 = (45 - |x)/5 (x = 36.75 

b) 1.65 = (45 - ri/10 |jl = 28.5 


c) z = (30 - 28.5)/10 = 0.15, 

entonces 0.5000 + 0.0596 = 0.5596 

a) 21.19%, calculado mediante z = (9.00 - 9.20)/0.25 = -0.80, 
entonces 0.5000 - 0.2881 = 0.2119 

b) Incremente la media, z = (9.00 - 9.25)/0.25 = -1 .00, 

P = 0.5000 - 0.3413 = 0.1587. 


Reduzca la desviación estándar. <r = (9.00 - 9.20)/ 

0.15 = -1.33; P = 0.5000 - 0.4082 = 0.0918. 

Reducir la desviación estándar es mejor porque un porcentaje 
menor de jamones estarán por debajo del límite. 

a) z = (60 - 52)/5 = 1 .60, así que 0.5000 - 0.4452 = 0.0548 

b) Seaz = 0.67, entonces 0.67 = (X - 52)/5 y X = 55.35, ajuste 
el millaje a 55 350 

c) z = (45 - 52)/5 = -1.40, entonces 0.5000 - 0.4192 = 0.0808 


470 - m- 

<T 


0.25 


500 — ¡x 

<j 


1.28 


<t = 29 126 y 


(j. = 462 718 

(x = 150(0.15) = 22.5 cr = Vi 50(0.1 5)(0.85) = 4.37 

z = (29.5 - 22.5)/4.37 = 1.60 

P(z > 1 .60) = .05000 - 0.4452 = 0.0548 

a) 0.4262, calculado por 1 - e [( ~ 1/27)(15)I 

b) 0.1 084, calculado por e [( ~ 1/27) (60)1 

c) 0.1403, calculado pore [( ~ 1/27)(30)1 - e [< ~ 1/27)(45)1 

d) 2.84 segundos, calculado por -27 ln(0.9) 

a) 0.2835, calculado por 1 - e [ (-V3o°ooo)(iooooo)] 

b) 0.1889, calculado pore [( ~ 1/300000)(50 ° 000)1 

c) 0.2020, calculado por e [ < 1 / 30 ° 000 ) « 200 000)1 - 

e [(-1 /300 000)(350 000)] 

d ) Tanto la media como la desviación estándar son 300 000 
horas. 

a) 0.0655, calculado por 0.5000 - 0.4345, con z = (3 500 - 

2 448)/698 = 1.51; esto nos lleva a 2.0 equipos, calculado por 
30(0.0655). En realidad, tres equipos tuvieron una asistencia de 
más de 3.5 millones, así que la estimación es bastante exacta. 

b) 0.8729, calculado por 0.5000 + 0.3729, con z = (50 - 
88.51)/33.90 = -1 .14; esto nos lleva a 26.2 equipos, calculado 
por 30(0.8729). Hay 27 equipos con salarios superiores a $50 
millones, así que la estimación es muy buena. 


CAPÍTULO 8 

a) 303 Lousiana, 5 155 S. Main, 3 501 Monroe, 2 652 W. Central. 

b) Las respuestas variarán. 

c) 630 Dixie Hwy, 835 S. McCord Rd, 4 624 Woodville Rd 

d) Las respuestas variarán 
3. a) Bob Schmldt Chevrolet 

Great Lakes Ford Nissan 
Grogan Towne Chrysler 
Southslde Lincoln Mercury 
Rouen Chrysler Jeep Eagle 

b) Las respuestas variarán 

c) Yark Automotive 

Thayer Chevrolet Geo Toyota 
Franklin Park Lincoln Mercury 
Mathews Ford Oregon, Inc. 

Valiton Chrysler 


Muestra 

Valores 

Suma 

Media 

1 

12, 12 

24 

12 

2 

12, 14 

26 

13 

3 

12, 16 

28 

14 

4 

12, 14 

26 

13 

5 

12, 16 

28 

14 

6 

14, 16 

30 

15 


b) (i* = (12 + 13 + 14 + 13 + 14 + 15)/6 = 13.5 

(x = (12 + 12 + 14 + 16)/4 = 13.5 

c) Mayor dispersión con los datos de la población, si se compara 
con las medias muéstrales, que varían de 12 a 15, mientras 
que la población varía de 12 a 16. 


Muestra 

Valores 

Suma 

Mediana 

1 

12, 12, 14 

38 

12.66 

2 

12, 12, 15 

39 

13.00 

3 

12,12, 20 

44 

14.66 

4 

14,15, 20 

49 

16.33 

5 

12, 14, 15 

41 

13.66 

6 

12, 14, 15 

41 

13.66 

7 

12,15, 20 

47 

15.66 

8 

12,15, 20 

47 

15.66 

9 

12, 14, 20 

46 

15.33 

10 

12, 14, 20 

46 

15.33 


„ (12.66 + ■■■ + 15.33 + 15.33) 

b) |x* = ^ ~ = 14.6 

)x = (12 + 12 + 14 + 15 + 20)/5 = 14.6 

c) La dispersión de la población es mayor que la de las medias 
muéstrales. Las medias muéstrales varían de 12.66 a 16.33, 
mientras que la población varía de 12 a 20. 

9. a) 20, calculado mediante 6 C 3 


Muestra 

Casos 

Suma 

Media 

Ruud, Wu, Sass 

3,6,3 

12 

4.00 

Ruud, Sass, Flores 

3, 3,3 

9 

3.00 

Sass, Flores, Schueller 

3, 3,1 

7 

2.33 


c) 

d ) 


53 33 

ixv = 2.67, calculado mediante — : — . 

™ 20 

)x = 2.67, calculado mediante (3 + 6 + 3 + 3 + 0 + 1)/6. 
Son iguales. 


Población 


"O 

CT3 

03 

-Q 

O 

oí 


.50 

.40 

.30 

.20 

.10 


i 1 1 — I— l 1 1 T- 

0 2 (J 4 6 


Número de casos 


813 


Distribución de las medias muéstrales 



1 2.0 3.0 4.0 

Número de casos en 
las medias muéstrales 


Medía 

de la muestra 

Número de medías 

Probabilidad 

1.33 

3 

.1500 

2.00 

3 

.1500 

2.33 

4 

.2000 

3.00 

4 

.2000 

3.33 

3 

.1500 

4.00 

3 

.1500 


20 

1.0000 


La población tiene mayor dispersión que las medias muéstrales. 
Las medias de la muestra varían de 1 .33 a 4.0; la población, 
de 0 a 6. 

11. a) 

.1 - 


.05 


0 

12 3 4 

0 + 1 + • • 

5 6 7 

+ 9 

8 9 




10 




Muestra 

Suma 

X 

Muestra 

Suma 

X 

1 

11 

2.2 

6 

20 

4.0 

2 

31 

6.2 

7 

23 

4.6 

3 

21 

4.2 

8 

29 

5.8 

4 

24 

4.8 

9 

35 

7.0 

5 

21 

4.2 

10 

27 

5.4 


3 r 

■- 9 

o ¿ — 
a 
<D 

O 1 - 

<u 1 

^ ü I II lili lili I L 

2.0 3 4 5 6 7 8 

Valores 


13. 

15. 


La media de las 1 0 medias muéstrales es de 4.84, que se 
aproxima a la media de la población de 4.5. Las medias 
muéstrales varían de 2.2 a 7.0, mientras que los valores de la 
población varían de 0 a 9. De acuerdo con la gráfica anterior, 
las medias muéstrales tienden a agruparse entre 4 y 5. 
a)-c) Las respuestas variarán dependiendo de las monedas que 
tenga. 


a) 


63 - 60 
12/V9 


0.75 


b) 


P = .2266, calculado con 


- 60 _ 
12/V9 ~~ 


P = .1587, calculado con 


.5000 - .2734 

.5000 - .3413 


17. 

19. 


21 . 


c) 

z 

a) 

b) 

c) 


a) 


P = .6147, calculado con 0.3413 + 0.2734 


1 950 - 2 200 


-7.07 P = 1,0 virtualmente cierta. 


250/V50 

Formal Man, Summit Stationers, Bootleggers, Leather Ltd, 
Petries. 

Las respuestas pueden variar. 

Elder-Beerman, Frederick Hollywood, Summit Stationers, Lion 
Store, Leather Ltd. Thlngs Remembered, County Seat, Coach 
House Gifts, Regis Hairstylists. 


Muestras 

Medía 

Desviación 
de la media 

Cuadrado de 
la desviación 

1, 1 

1.0 

-1.0 

1.0 

1,2 

1.5 

-0.5 

0.25 

1,3 

2.0 

0.0 

0.0 

2,1 

1.5 

-0.5 

0.25 

2,2 

2.0 

0.0 

0.0 

2,3 

2.5 

0.5 

0.25 

3,1 

2.0 

0.0 

0.0 

3,2 

2.5 

0.5 

0.25 

3,3 

3.0 

1.0 

1.0 


ib) La media de las medias muéstrales es (1 .0 + 1 .5 + 2.0 + ■ ■ • + 
3.0)/9 = 18/9 = 2.0 La media poblacional es (1 + 2 + 3)/3 = 

2. Son el mismo valor. 

c) La varianza de las medias muéstrales es (1 .0 + 0.25 + 

0.0 + ■■■ + 3.0)/9 = 18/9 = 2.0 La media poblacional es 

(1 + 1 ,0)/9 = 1 /3. La varianza de los valores poblaclonales es 
(1 + 0 + 1)/3 = 2/3. La varianza de la población es dos veces 
más grande que la de las medias muéstrales. 

d ) Las medias muéstrales siguen un pico triangular a 2. La 
población es uniforme entre 1 y 3. 

23. Muestras mayores proporcionan estimaciones más precisas de una 
media poblacional. Así que la compañía con 200 clientes 
encuestados puede ofrecer estimaciones más precisas. Además, 
se trata de clientes selectos familiarizados con las computadoras 
portátiles, que pueden estar mejor calificados para evaluar la nueva 
computadora. 

25. a) Seleccione 60, 104, 75, 72 y 48. Las respuestas variarán. 

b) Seleccione la tercera observación. De modo que la muestra 
consiste en 75, 72, 68, 82 y 48. Las respuestas varían. 

c) El número de los primeros 20 moteles de 00 a 1 9. Seleccione 
tres números al azar. En seguida enumere los cinco últimos de 
20 a 24. Seleccione al azar dos números de ese grupo. 

27. a) 15, calculado mediante 6 C 2 


Muestra 

Valor 

Suma 

Media 

1 

79, 64 

143 

71.5 

2 

79, 84 

163 

81.5 

15 

92, 77 

169 

84.5 




1 195.0 


814 


c) (jlx = 79.67, calculado mediante 1 195/15. 

|jl = 79.67, calculado mediante 478/6. 

Son iguales. 

d ) No. El estudiante no obtiene calificaciones en toda la 
información disponible. Es tan probable que obtenga una 
calificación más baja sobre la base de la muestra como una 
calificación alta. 

29. a) 10, calculado con 5 C 2 


Número 
de cortes 

Media 

Número 
de cortes 

Media 

4,3 

3.5 

3,3 

3.0 

4,5 

4.5 

3,2 

2.5 

4,3 

3.5 

5,3 

4.0 

4,2 

3.0 

5,2 

3.5 

3,5 

4.0 

3,2 

2.5 


Media 

muestral 

Frecuencia 

Probabilidad 

2.5 

2 

.20 

3.0 

2 

.20 

3.5 

3 

.30 

4.0 

2 

.20 

4.5 

1 

.10 


10 

1.00 


31. 


33. 


c) 


d) 

a) 

b) 

c) 


d) 


e) 


(jlx = (3.5 + 4.5 + ■ • ■ + 2.5)/10 = 3.4 
(i = (4 + 3 + 5 + 3 + 2)/5 = 3.4 
Las dos medias son iguales. 

La forma de los valores de la población es relativamente 
uniforme. La distribución de la muestra tiende a la normalidad. 
La distribución será normal. 


_ 5.5 
“ V25 
36 - 35 
5.5/V25 


= 1.1 


= 0.91 


P = 

z = 


0.1814, calculado por 


34.5 - 35 
5.5/V25 


-0.45 


0.5000 


0.3186 


P = 0.6736, calculado por 0.5000 + 0.1736 


0.4922, calculado por 0.3186 + 0.1736 
$335 - $350 _ 

$45/V40 


35. 


37. 


39. 


41. 


P = 0.9826, calculado por 0.5000 + 0.4826 

25.1 - 24.8 

Z_ 2.5/V60 _0 ' 93 
P = 0.8238, calculado por 0.5000 + 0.3238 
Entre 5 954 y 6 046, calculado por 
6 000 ± 1 .96 (150/V40) 

900 - 947 


= -1.78 


43. a) z 


205/V60 

P = 0.0375, calculado por 0.5000 - 0.4625 

Alaska, Connectlcut, Georgia, Kansas, Nebraska, Carolina del 
Sur, Virginia, Utah. 

Arizona, Florida, lowa, Massachusetts, Nebraska, Carolina del 
Norte, Rhode Island, Vermont. 

600 - 510 

= 19.9, P = 0.00, 


a) 

b ) 


14.28/VTO 
o virtualmente nunca. 

„ 500 - 510 

b) Z ~ 14.28/VTO” 2 ' 21, 

P = 0.4864 + 0.5000 = 0.9864 
, 500 - 510 

C) Z_ 14.28/V10 “ 2 ' 21 ’ 

P = 0.5000 - 0.4864 = 0.0136 


45. a) 

b) 

c) 

d) 


2.1 

dv = — j== = 0.23 
* V8T 

7.0 - 6.5 6.0 - 6.5 

z = = 2 14 z = 

2.1/V81 ' ’ 2.1/V81 

P = .4838 + .4838 = .9676 


-2.14, 


_ 6.75 - 6.5 _ 6.25 - 6.5 

Z_ 2.1/V8T ~~ ’ Z ~ 2.1/V81 

P = .3577 + .3577 = .7154 
.0162 calculado por .5000 - .4838 


-1.07, 


47. La asistencia media de 2009 es de 2.448 millones. La probabilidad 
de una media muestral de este tamaño o mayor es 0.0606, 
calculado por 0.5000 - 0.4394. El valor z es 1.55. 


CAPÍTULO 9 

1. 51.314 Y 58.686, que se determina mediante 55 ± 2.58(1 0/V49) 

3. a) 1 .581 , calculado mediante o y = 25/V250 

b) La población tiene una distribución normal y se conoce la 
varianza de la población. 

c) 16.901 y 23.099, que se determina mediante 20 ± 3.099 

5. a) $20. Es nuestra mejor estimación de la media de la población. 

b) $1 8.60 y $21 .40, que se determinan por medio de 
$20 ± 1 ,96($5/V59). Cerca de 95% de los intervalos 
construidos de manera similar incluirán la media de la 
población. 

7. a) 8.60 galones 

b) 7.83 y 9.37, que se determinan por medio de 
8.60 ± 2.58(2.30/V60) 

c) Si se determinan los 1 00 intervalos, la media de la población se 
incluirá en 99 intervalos. 

9. a) 2.201 

b) 1 .729 

c) 3.499 

11. a) Se desconoce la media, pero la mejor estimación es 20, la 
media de la muestra. 

b) Utilice la distribución f, ya que no se conoce la desviación 
estándar. Sin embargo, suponga que la población tiene 
distribución normal. 

c) 2.093 

d ) Entre 19.06 y 20.94, que se determinan mediante 
20 ± 2.093(2/V20) 

e) Ningún valor es razonable, porque no se localiza dentro del 
intervalo. 

13. Entre 95.39 y 1 01 .81 , que se determinan por medio de 

98.6 ± 1 .833(5. 54/VTO) 


15. 


a) 0.8, que se determina mediante 80/100 

b) Entre 0.72 y 0.88, que se calcula mediante 


0.8 ± 1.961 


0 . 8(1 - 0 . 8 ) 
100 


17. 


c) Hay seguridad razonable de que la proporción de la población 
se encuentra entre 72 y 88%. 

a) 0.625, que se determina mediante 250/400. 

b) Entre 0.563 y 0.687, que se determina mediante 


0.625 ± 2.58 


0.625(1 - 0.625) \ 


400 




c) Hay segundad razonable de que la proporción de la población 
se encuentra entre 56 y 69%. 

19. 33.41 y 36.59, determinado mediante 


35 ± 2.030 


5 

V36 


300 - 36 
300 - 1 


21. 1 .683 y 2.037, determinado por 


0.5 

V50 


1.86 ± 2.680 

23. 97, determinado por n 
25. 196, determinado porn = 0.15(0.85) 


400 - 50 
400 - 1 

1.96 x 10 V 
2 


96.04 
1 .96 Z 2 


0.05 


= 195.9216 


815 


27. 554, determinado por n 


33. 


35. 


1.96 X 3 Y 
0.25 


= 553.19 


63. Entre 0.573 y 0.653, que se determina mediante 


29. a) 577, que se determina mediante 
= 576.24 


.613 ± 2.58 


0.613(1 - 0.613) 
1 000 


. Sí, porque incluso el límite in- 


n = 0 - 60 (°- 40 W 

b) 601 , que se determina mediante 

/ 1.96 Y 

n = 0.50(0.50)1 — — J = 600.25 


0.17 ± 1.96 


31. 


6.13 a 6.87 años, que se determina por medio de 
6.5 ± 1. 989(1. 7/V85) 

a) Entre $313.41 y $332.59, que se calcula mediante 

323 ±Z426 (w) 

b) $350 no es razonable, porque se encuentra fuera del intervalo 
de confianza. 

a) Se desconoce la población media. 

b) Entre 7.50 y 9.1 4, que se determina mediante 
8.32 ± 1 . 685(3. 07/V40) 

c) 1 0 no es razonable porque se encuentra fuera del intervalo de 
confianza. 

37. a) 65.49 a 71 .71 horas, que se determina mediante 
68.6 ± 2.680(8.2/V50) 

ib) El valor sugerido por la NCAA se incluye en el intervalo de 
confianza. Por lo tanto, es razonable, 

c) Cambiar el intervalo de confianza a 95 disminuiría la amplitud 
del intervalo. El valor de 2.680 cambiaría a 2.010. 

61, determinado mediante 1.96(16/Vñ) = 4 
Entre $13 734 y $15 028, que se encuentra por medio de 
14 381 ± 1.711(1 892/V25). 15,000 resulta razonable porque se 
encuentra dentro del intervalo de confianza, 

a) $62.583, que se determina por medio de $751/12 
Entre $60.54 y $64.63, que se determina mediante 
62.583 ± 1 .796(3. 94/VT2) 

$60 no es razonable, porque se encuentra fuera del intervalo 
de confianza. 

89.4667, que se determina mediante 1 342/15 
Entre 84.99 y 93.94, que se determina por medio de 
89.4667 ± 2.145(8.08/Vl5) 

Sí, porque inclusive el límite inferior del intervalo de confianza 
se encuentra por arriba de 80. 

El intervalo de c onfianza está entre 0.01 1 y 0.059, calculado por 
0.035(1 - 0.035) \ 

400 )' 

que menos de 5% de los empleados fallan en la prueba, porque 
0.05 está dentro del intervalo de confianza. 

$52.51 y $55.49, que se determina por medio de 
$4.50 / (500 - 35) 

V35 V 500 — 1 

369, que se encuentra por medio de n = 0.60(1 - 0.60)(1 .96/0.05) 2 
97, que se determina mediante (1.96 x 500)/100] 2 

Entre 7 849 y 8 1 51 , calculado por 8 000 ± 2.756(300/V30) 

(1 ,96)(300) Y 
25 ) 


ferior del intervalo de confianza se encuentra por encima de 0.500. 
65. a) Entre 0.156 y 0.184, calculado por 
/(0. 17)(1 -0.17) 

2 700 

b) Sí, porque 1 8% está dentro del intervalo de confianza. 

c) 21 682; determinado por 0.17(1 - 0.17)[1 .96/0.005] 2 
67. Entre 1 2.69 y 1 4.1 1 , que se determina mediante 1 3.4 ± 

1 .96 (6.8/V352). 

69. a) Para el precio de venta de 21 1.99 a 230.22, determinado por 
221.1 ± (1.983)(47.11/\T05) = 221.1 ±9.12 

b) Para la distancia: 13.685 a 15.572, que se determina mediante 
14.629 ± (1 .983)(4.874/VT05) = 14.629 ± 0.943 

c) Para la cochera: 0.5867 a 0.7657, que se determina por 


0.6762 ± (1 .96) 


0.6762(1 - 0.6762) 
105 


= 0.6762 ± 0.0895 


d ) Las respuestas variarán. 

71. a) Entre $438.34 y 462.24, calculado por 


450.29 ± 1 


99 f 53 ™) 

\vmj 


b) Entre 820.72 y 839.50, calculado por 
M2.19 \ 

V80 / 

c) Las respuestas variarán. 


830.11 ± 1.99 


39. 

41. 


43. 


45. 


47. 


49. 


51. 

53. 

55. 


b) 

c) 

a) 

b) 


0.035 ± 2.581 


$54.00 ± 2.032- 


No sería razonable concluir 


57. 


59. 


61. 


554, que se determina mediante n 


Entre 75.44 y 80.56, que se determina mediante 
78 ± 2.01 0(9/ V50) 

/ (1 .65)(9) Y 

221 , que se encuentra mediante n = I — — — \ 

30, calculado por 180/V36 

$355.1 0 y $476.90, calculado por $41 6 ± 2.030( 


c) Alrededor de 1 245, determinado por 


1.96(1 80) Y 
10 ) 


CAPITULO 10 

1. a) De dos colas. 

b) Rechace H 0 y acepte H 1 cuando z no caiga en la región de 
-1.96 a 1.96. 

c) -1 .2, que se calcula por medio de 
z = (49 - 5 0) / (5 /a/36) = -1.2 

d) No se rechaza H 0 . 

e) p = 0.2302, que se determina mediante 2(.5000 - .3849). Una 
probabilidad de 23.02% de encontrar un valor z de este 
tamaño cuando H 0 es verdadera. 

3. a) Una cola. 

í>) Rechace H 0 y acepte H-, cuando z > 1 .65. 

c) 1.2, que se determina mediante z = (21 - 20)/(5/V36) = 1 .2 

d) No se rechaza H 0 en el nivel de significancia de 0.05. 

e) p = .1151, calculado por .5000 - .3849. Una probabilidad de 
1 1 .51 % de encontrar un valor z de ese tamaño o más grande. 

5. a) H 0 : jjl = 60 000 H,: p. + 60 000 

b) Rechace H 0 si z < -1 .96 oz > 1 .96. 

c) -0.69, calculado por: 

59 500 - 60 000 
Z " (5 000/V48) " 

d) No se rechace H 0 . 

e) p = .4902, calculado por 2(.5000 - .2549). La experiencia de 
Crosset no difiere de la manifestada por el fabricante. Si H 0 es 
cierta, la probabilidad de hallar un valor más extremo que éste 
es de 0.4092. 

7. a) H 0 : |x ^ 6.8 H^: jjl < 6.8 

b) Rechace H 0 si z < - 1 .65 
, 6.2 - 6.8 
C) Z " 0.5/V36 " 

d) Se rechaza H 0 . 

e) p = 0. El número medio de los DVD que se observó es menor a 
6.8 al mes. Si H 0 es verdadera, hay pocas probabilidades de 
obtener una estadística así de pequeña. 

9. a) Se rechaza H 0 si f > 1 .833. 

b) t = l 2 , Jf = 2.108 


a) 708.1 3, redondeado a 709, que se determina por 0.21 (1 
0.21 )(1 .96/0.03) 2 

b ) 1 066, calculado por 0.50(0.50)(1 .96/0.03) 2 


(3/VTO) 

c) Se rechaza H 0 . La media es mayor que 1 0. 


816 


11 . H 0 : n < 40 H 1 : l i>401 

Rechace H 0 si í > 1 .703. 


13 . 


42 - 40 
(2.1/V28) 


5.040 


Rechace H 0 y llegue a la conclusión de que la cantidad media de 
llamadas es superior a 40 por semana. 

H 0 : (jl < 40 000 H,: |x > 40 000 


Rechace H 0 si í > 1 .833. 


50 000 - 40 000 
t = — — = 3.16 

1 o ooo/VTo 

Rechace H 0 y llegue a la conclusión de que el ingreso medio en 
Wilmington es mayor a $40 000. 

15. a) Rechace H 0 si í < -3.747. 

— I 50 

b) X = 17 y s = = 3.536 

V 5 — 1 

17-20 

f _ (3.536/V5) _ 

c) No rechace H 0 No es posible llegar a la conclusión de que la 
media de la población es menor a 20. 

d ) Entre 0.05 y 0.10, cerca de 0.065. 

17. H 0 : (jl < 1.4 H-,-. (jl > 1.4 

Rechace H 0 si f > 2.821 . 

1.6 - 1.4 

t = -OQ*? 

0.216/V10 

Rechace H 0 y concluya que la droga ha aumentado la orina. El valor 
p está entre 0.01 y 0.005. Hay una ligera probabilidad (entre 1 en 
100 y una en 200) de que este aumento pueda haber sido casual. 
19. H 0 : |jl ^ 50 Hy (jl > 50 
Rechace H 0 si f > 1 .796. 


82.5 - 50 
59.5/V12 


1.89 


Rechace H 0 y concluya que el número medio de mensajes de texto 
es mayor a 50. El valor p es menor a 0.05. Hay una ligera probabili- 
dad (menos de 1 en 20), que esto pueda haber sido casual. 

21. a) H 0 se rechaza si z > 1 .65. 

b) 1 .09, determinado mediante 

z = (0.75 - 0.70)/V(0.70 X 0.30)/100 

c) H 0 no se rechaza. 

23 . a) H 0 : ir <0.52 Hy ir > 0.52 

b) H 0 se rechaza si z > 2.33. 

c) 1 .62, determinado porz = (.5667 - ,52)/V(0.52 x 0.48)/300 

d ) H 0 no se rechaza. No puede concluir que la proporción de 
hombres que manejan en Ohio Tumpike es mayor a 0.52. 

25 . a) H 0 : ir >0.90 H,: ir < 0.90 

b) H 0 se rechaza si z < -1 .28. 

c) -2.67, que se determina por medio de 
z = (0.82 - 0.90)/V(0.90 X 0.10)/100 

d) Se rechaza H 0 . Menos de 90% de los clientes recibieron sus 
órdenes en menos de 10 minutos. 

27 . 1 .05, que se determina porz = (9 992 - 9 880)/(400/v'100). 
Entonces 0.5000 - 0.3531 = 0.1469, que es la probabilidad de 
cometer un error tipo II. 

29 . H 0 : |JL = $45 000 Hy (jl + $45 000 


Rechace H 0 si z < - 1 .65 o z > 1 .65. 


45 500 - 45 000 _ „„ 

$3 000/V120 

Rechace H 0 . Puede concluir que el salario medio no es de $45 000. 
Valor p de 0.0672, determinado mediante 2(0.5000 - 0.4664). 


31 . H 0 : (jl > 1 0 H,: (jl < 10 

Rechace H 0 si z < - 1 .65. 


33 . 


9.0 - 10.0 
2.8/V50 


-2.53 


Rechace H 0 . La pérdida media de peso es menor a 10 libras. Valor 
p = 0.5000 - 0.4943 = 0.0057 
H 0 : (j, ^ 7.0 Hy (jl < 7.0 


Suponiendo 5% de nivel de significancia, rechace H 0 si f < - 1 .677. 


35 . 


6.8 - 7.0 
0.9/V50 


-1.57 


No se rechaza H 0 . Los estudiantes de West Virginia no duermen 
menos de 6 horas. El valor p se encuentra entre 0.05 y 0.1 0. 

H 0 : (l > 3.13 H,: (jl < 3.13 


Rechace H 0 si f < -1.711 


37 . 


2.86 - 3.13 
1 .20/V25 


-1.13 


Rechace H 0 y concluya que el número medio de residentes no 
necesariamente es menor a 3.13. 


H 0 : (jl < 14 H,: (jl > 14 


Rechace H 0 si f > 2.821 . 
X = 15.66 s = 1.544 


39 . 


15.66 - 14.00 
1 ,544/VlO 


3.400 


Rechace H 0 . La tasa promedio es superior a 14%. 

H 0 : (jl = 3.1 Hy (jl + 3.1 Suponga una población normal. 


Rechace H 0 si f < -2.201 o f > 2.201 . 


X = 


41.1 
~ \2 


3.425 


s = 


4.0625 
12 - 1 


= .6077 


41 . 


.425 - 3.1 
.6077/ Y12 


No rechace H 0 . No se puede mostrar una diferencia entre los 
ciudadanos de la tercera edad y el promedio nacional. El valor p se 
encuentra cerca de 0.09. 

H 0 : (l > 6.5 H,: (jl < 6.5 Suponga una población normal. 


Rechace H 0 si f < -2.718. 
X= 5.1667 s = 3.1575 


5.1667 - 6.5 
3.1575/VT2 


-1.463 


No rechace H 0 . El valor p es mayor que 0.05. 
43 . H 0 : (jl = 0 Hp (x ^ 0 

Rechace H 0 s¡ f < -2.1 10 o f > 2.1 10. 

X= -0.2322 s = 0.3120 


-0.2322 - 0 
0.3120/V18 


-3.158 


Rechace H 0 . La media gana o pierde pero no es igual a 0. El valor p 
es menor que 0.01 , aunque mayor que 0.001 . 

45 . H 0 : (jl < 100 Hy (jl > 100 Suponga una población normal. 


Rechace H 0 si f > 1 .761 . 


1 641 
15 


1 389.6 _ 
15 - 1 
109.4 - 100 
9.9628/V15 


109.4 

9.9628 

= 3.654 


Rechace H 0 . El número medio con el escáner es mayor a 100. El 
valor de p es de 0.001 . 


817 


47. H 0 : ¡jl = 1 .5 H,: |x ^ 1.5 

Rechace H 0 si f > 3.250 o f < -3.250. 

1.3 - 1.5 


51. 


53. 


55. 


57. 


f : 


0.9/vra 


= -0.703 


o se rechaza H a 


49. a) 


b) 

c) 


Esta es una situación binomiai, en donde tanto el número 
medio de éxitos como el de fracasos son iguales a 21 .5, 
calculado por 0.5 X 43. 

H 0 : ir = 0.50 Hy ir + 0.50 

Trazo de la distribución 

Normal, media = 0, Desv. Est. = 1 



- 2.576 


0 

Valor z 


2.576 


d) z = 


Rechace H 0 si z no está entre -2.576 y 2.576. 
29'' 

43/ 


- 0.50 


= 2.29 No se rechaza la 


e) 


V0.50(1 - 0.50)/43 

hipótesis nula. Estos datos no prueban que el giro de la 
moneda tenga un sesgo. 

El valor p es 0.0220, calculado por 2 x (0.5000 - 0.4890). Un 
valor así de extremo ocurrirá aproximadamente sólo una vez en 
cincuenta con una moneda. 

H 0 : ir < 0.60 Hy ir > 0.60 
Rechace H 0 si z > 2.33. 

.70 - .60 „ „„ 

= 2.89 


,60(.40) 

200 

Se rechaza H 0 . La señorita Dennis está en lo correcto. Más de 60% 
de las cuentas tiene más de 3 meses de antigüedad. 

H 0 : TT < 0.44 Hy ir > 0.44 
H 0 se rechaza si z > 1 .65. 

0.480 - 0.44 

: = 2.55 


V(0.44 X 0.56)/1 .000 
Se rechaza H 0 . Concluya que ha aumentado la proporción de 
personas que quieren ir a Europa. 

H 0 : ir < 0.20 Hy tt > 0.20 
Se rechaza H 0 si z > 2.33 

, _ (56/200) - 0.20 _ , a , 

V(0.20 X 0.80J/200 

Se rechaza H 0 . Más de 20% de los propietarios se muda durante 
un año en particular. Valor p = 0.5000 - 0.4977 = 0.0023. 

H 0 : tt < 0.40 Hy tt > 0.40 
Rechace H 0 si z es mayor a 2.326. 

(16/30) - 0.40 _ H<n 
V[0.40(1 - 0.40)/30] 

No se rechaza la hipótesis nula. Estos datos no muestran que los 
estudiantes universitarios sean más propensos a saltarse el 
desayuno. 


59. 


61. 


63. 


65. 


H 0 : ir > 0.0008 Hy ir < 0.0008 
Se rechaza H 0 si z < - 1 .645. 

0.0006 - 0.0008 


0.0008 (0.9992) 


= -0.707 H 0 no se rechaza 


a) 

b) 


10 000 

Estos datos no prueban que haya una reducción en el rango de 
fatalidades. 

9.00 ± 1.65(1/V36) = 9.00 ± 0.275 
De modo que los límites son 8.725 y 9.275. 
z = (8.725 - 8.900)/(1/V36) = -1.05 
P(z > -1.05) = 0.5000 + 0.3531 = 0.8531 
c) z = (9.275 - 9.300)/(1/V36) = -0.15 
P(z < -0.15) = 0.5000 - 0.0596 = 0.4404 

50 + 2.33 —j= = 55 — .525 —7= n = (5.71) 2 = 32.6 
Vn Vn 

Sea n = 33. 

H 0 : p. ^ 8 Hy fj. < 8 
Se rechaza H 0 s\t < -1 .714. 


67. 


_ 7.5 - 8 
f “ 3.2/V24 


-0.77 


No se rechaza la hipótesis nula. El tiempo no es menor. 

a) H 0 \ fj. — 80 H{. \l ± 80 

Rechace H 0 si f no está entre -2.045 y 2.045. 

83.51 - 80 

f = qq nn/ /o ís = 1 38 No rec hace la hipótesis nula, 
oo.yu/ v oU 

El salario medio podría ser de $80 millones. 

b) H 0 \ |jl s 2 000 000 H{. |x > 2 000 000 

Rechace H 0 si t es > 1 .699. 

2 448 000 - 2 000 000 „ 

698 000/V30 ” ' 

Rechace la nula. La asistencia media fue mayor a 2 000 000. 


CAPÍTULO 11 

3. a) Prueba de dos colas 

b) Rechace H 0 si z < -2.05 oz > 2.05 



d) Rechace H 0 

e) Valor p = 0.0096, determinado por 2(0.5000 - 0.4952) 

3. Paso 1 H 0 : ^ p. 2 Hy ^ < p, 2 

Paso 2 Se eligió el nivel de significancia de 0.05. 

Paso 3 Rechace H 0 si z < - 1 .65. 

Paso 4 -0.94, determinado mediante: 


z = 


7.6 - 8.1 



(2-9) 2 

55 


-0.94 


Paso 5 Falla a rechazar H 0 . Los bebés que usaron la marca Gibbs 
no ganaron menos peso. Valor p = 0.1736, determinado mediante 
0.5000 - 0.3264. 

5. H 0 : n-i s m - 2 H{. (jl, > 

Si z > 1 .65, rechace Fl 0 . 


z = 


61.4 - 60.6 
( 1 - 2) 2 
45 


(1-1) 2 

39 


3.187 


Rechace la hipótesis nula. Es razonable concluir que quienes 
tuvieron una operación cesárea son más pequeños. 

El valor p es vlrtualmente cero. Esa diferencia casi nunca se debe a 
un error de muestreo. 
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17. 


a) Rechace H 0 si z > 1 .65 

b) 0.64, determinado por p c = 

c) 1 .61 , determinado por 


70 + 90 
100 + 150 


0.70 - 0.60 


9. 


V[(0.64 X 0.36)/ 100] + [(0.64 X 0.36)/150] 

d ) No rechace H 0 

a) H 0 : TT ^ — 1 T 2 /"/- j . m" i ir 2 

Rechace H 0 si z < - 1 .96 o bien z > 1 .96 
24 + 40 


b) 

c) 

d) 


^ 400 + 400 °'° 8 

-2.09, determinado por 


0.06 - 0.10 


e) 


Pc = 


800 + 1 000 


0.2044 


0.21 - 0.20 


(0.2044)(0.7956) (0.2044)(0.7956) 


: = 0.52 


800 


1 000 


No rechace H 0 . No hay diferencia entre las proporciones de 
demócratas y republicanos que favorecen los estándares. Valor 
p = 0.3015. 

13. a) RechaceH 0 si f >2.120 o f < -2.120g/ = 10 + 8 - 2 = 16 

,2 (10 — 1)(4) 2 + (8 - 1)(5) 2 


b) 4 


c) t = 


10 + 8-2 
23 - 26 


= 19.9375 


-1.416 


/i9 - 9375 GW) 

d) No rechace H 0 

e) El valor p es mayor que 0.1 0 y menor que 0.20. 

15. H 0 : ■ |j 2 H.: ji] fi : :, g/ — 12 + 13 — 2 — 23 

Rechace H 0 si f no está entre -2.807 y 2.807. 


s 2 = 

°p 


(12 - 1)(8 242) 2 + (13 — 1)(10 369) 2 


12 + 13 
7 240 - 9 188 


88 584 000 


88 584 000( ^ ^ 


-0.517 


No rechace H 0 . No hay diferencia entre los salarios medios. 

H 0 '■ M-s - M-a H 1 : M-s > M-a 

g/ = 6 + 7- 2 = 11 
Rechace H 0 si f > 1 .363 

2 (6 - 1)(12.2) 2 + (7 - 1)(15.8) 2 

Sp ~ 6 + 7-2 

142.5 - 130.3 


= 203.82 


t = 


203.82[ 1 + y 


: = 1.536 


Rechace H 0 . Los gastos medios diarios del personal de ventas son 
mayores. El valor p se encuentra entre 0.05 y 0.1 0. 


19. a) gl 


25 225 \ 2 

15 1 12 j 


416.84 


15 - 1 
= 12.96 —i 


(fj 
f 12 - 1 
12g/ 


0.1984 + 31.9602 


b) H 0 : m = n, 2 H,: |x-, # n, 2 

Rechace H 0 si f > 2.179 o f < - 

50 - 46 

c) f = . = 0.8852 

f 25 225 

T5 + 

d) No rechace la hipótesis nula. 

/ 697 225 2 387 025 

V 16 + 18 


V[(0.08 X 0.92)/400] + [(0.08 X 0.92)/400] 
Rechace H 0 . La proporción Infestada no es la misma en los dos 
campos. 

11. H 0 : 7 T d ^ TT r H-\\ 7T d > TT r 
Rechace H 0 si z > 2.05 

168 + 200 


25. 


31. 


-2.179. 


21. a) g i 


697 225 V 
16 ) 


+ 


2 387 025 
18 


26.7 — >26g/ 


23. 


b) 

c) 

d ) 
a) 

c) 

d) 

e) 


16-1 18-1 

H 0 - M-Rusia — M-China bl i . |J-Rusia ■+ M-China 

Rechace H 0 si f > 1 .706 
12 840 - 11 045 
/2 387 025 697 225 

T8 + 16 

Rechace la hipótesis nula. El costo medio de adopción en Rusia 
es mayor que el costo medio de adopción en China. 

Rechace H 0 s\t> 2.353 


12 


t = 


= 3.00 
t 

3.00 


= 0.816 


: = 7.35 


0.816/V4 

Rechace H 0 . Hay más partes defectuosas producidas en el 
turno matutino. 

El valor p es menor que 0.005, pero mayor que 0.0005. 


H. 


i- M-d 


M-d - 0 

d = 25.917 
s d = 40.791 

Rechace H 0 si f > 1 .796 
t = 


> 0 


25.917 


= 2.20 


27. 


40.791 /V12 

Rechace H 0 . El plan de incentivos resultó en un aumento del 
Ingreso diario. El valor p es aproximadamente 0.025. 

H 0 - M-m = M-w H i : m-m ^ M-w 

Rechace H 0 si gl = 35 + 40 -2, t < -2.645 o bien t > 2.645 
(35 - 1)(4.48) 2 + (40 - 1)(3.86) 2 
35 + 40 -2 
24.51 - 22.69 


s 2 = 


= 17.3079 


t = 


V i7 - 3079 (¿ + ¿) 


= 1.890 


29. 


Jl_ 

^35 ' 40 j 

No rechace H 0 . No hay diferencia entre los números de veces que 
los hombres y las mujeres compran comida para llevar en un mes. 
El valor p se encuentra entre 0.05 y 0.10. 

H 0 : (j.-! = p. 2 H-¡ . i ¡.-i (i 2 

Rechace H 0 si z < - 1 .96 o z > 1 .96 
4.77 - 5.02 

= -1.04 


(1.05) 2 (1.23) 2 


40 50 

No rechace H 0 . No hay una diferencia entre los números medios de 
llamadas. El valor p = 2(0.5000 - 0.3508) = 0.2984. 

H 0 : M-e s fj,,, (x B > ^ 

Rechace H 0 si t > 1 .668 

$61 000 - $57 000 $4 000.00 


t - 


($7 100) 2 ($9 200) 2 $1 948.42 


- 2.05 


30 


40 


Rechace H 0 . El Ingreso medio del plan B es mayor. El valor p = 
0.5000 - 0.4798 = 0. 0202. El sesgo no importa debido a los 
tamaños de las muestras. 
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33. 


35. 


39. 


H g. TTi ' TT 2 H^. ^1 ^ TT 2 

Rechace H 0 si z > 1 .65 

180 + 261 

Pe = 


= 0.882 


200 + 300 

0.90 - 0.87 

0.882(0.118) 0.882(0.118) 


= 1.019 


200 300 

No se rechaza H 0 . No hay una diferencia relevante entre las 
proporciones que tuvieron alivio con las drogas nuevas y anteriores. 

H q. 7Ti — TT 2 /I-j . 7T -j ^ 1T 2 

Si z > 2.33, rechace /-/ 0 . 

990 + 970 

Pe = = 0.63 


1 500 + 1 600 
.6600 - .60625 
63(.37) .63037) 


3.10 


+ 


37. 


1 500 1 600 

Rechace la hipótesis nula. No es posible concluir que es mayor la 
proporción de hombres que considera que la división es justa. 

H 0 : ir, < ir 2 H, : ir, > ir 2 Rechace H 0 si z > 1 .65 

.091 + .085 

Pe ~ r, 


= .088 
0.091 - 0.085 


(0.088) (0.91 2) (0.088) (0.91 2) 


= 1.059 


5 000 5 000 

No rechace la hipótesis nula. No ha existido un aumento en la 
proporción de condiciones de llamadas “buenas”. El valor p 0.1446, 
calculado por 0.5000 - 0.3554. El incremento de los porcentajes 
ocurrirá por azar en uno de cada siete casos. 

Hq. 77-1 = TT 2 r7-|] 7T-| A TT 2 

Rechace H 0 si z no está entre -1 .96 y 1 .96. 

100 + 36 

Pe = ...... = -272 


300 + 200 


100 

300 


36 

200 


(0.272) (0.728) (0.272) (0.728) 


= 3.775 


300 200 

Se rechaza la hipótesis nula. Hay diferencias entre las respuestas 
de los sexos. 


41. a) gl 


0.3136 0.0900 

+ 


12 


12 


/ 0.31 36 V 

( 0.0900 V 

V 12 J 

v 12 y 


12 - 1 


12 - 1 


0.0011 


0.000062 + 0.0000051 

b ) H o '■ M-a = Mw H v M-fl * Mw 

Rechace H 0 si f > 2.120 o f < -2.120 
1.65 - 2.20 


= 16.37^16g/ 


c) t 


r- 


3136 0.0900 

+ - 


= -3.00 


12 12 

d) Rechace la hipótesis nula. Hay una diferencia. 

43. Asuma que las desviaciones estándares poblacionales son iguales. 
Ho ■ M-n = M-s H,: p.„ A jx s 
Rechace H 0 si f < -2.086 o t > 2.086 

(10 - 1 )(1 0.5) 2 + (12 - 1)(14 .25) 2 
10 + 12-2 


Se = 


= 161.2969 


f = - 


83.55 - 78.8 


V i 6 i - 2969 (iV¿ 


: = 0.874 


Valor p > 0.10. No rechace H 0 . No hay diferencia entre los números 
medios de hamburguesas vendidas en las dos locaciones. 


45. Asuma que las desviaciones estándares poblacionales son iguales. 
H 0 \ jx-, = jx 2 H,. i x-i A ¡l 2 
Rechace H n si f > 2.819 o f < -2.819 


(10 - 1)(2.33) z + (14 - 1)(2.55) 2 


t = 


10 + 14-2 
15.87 - 18.29 


= 6.06 


VKiWt) 


= -2.374 


No rechace H 0 . No hay diferencia entre las cantidades medias 
compradas. 

47. Asuma que las desviaciones estándares poblacionales son iguales. 
H 0 : ix-, < |x 2 ( jl 1 > | a 2 Rechace H 0 si f > 2.567 

, (8 - 1)(2.2638) 2 + (11 - 1)(2.4606) 2 

s 2 = 


t = 


8 + 11 

10.375 - 5.636 


5.672 


1 1 

h 

8 11 


- 2 
= 4.28 


5.672 


Rechace H 0 . El número medio de transacciones de los adultos 
jóvenes es mayor que el de los adultos mayores. 

49. H 0 : ix-, s (x 2 H{. |x, > (x 2 Rechace H 0 si f > 2.650 

X, = 125.125 s, = 15.094 
X 2 = 117.714 s 2 = 19.914 

. (8 - 1)(1 5.094) 2 + (7 - 1 )(1 9.91 4) 2 

Sp “ 8 + 7-2 

125.125 - 117.714 


305.708 


f : 


305.7081 1 + y 


: = 0.819 


No se rechaza H 0 . No hay diferencia entre el número medio vendido 
al precio regular y el número medio vendido al precio reducido. 

51. H 0 : |x d < 0 ^x d > 0 Rechace H 0 si f > 1 .895 

5=1.75 s d = 2.9155 
1.75 


í = 


1.698 


2.9155/V8 ' 

No rechace H 0 . No hay diferencia entre los números medios de 
ausencias. El valor p es mayor que 0.05 pero menor que 0.10. 
53. H q. (x^ — ^. 2 H |x, A [íj 2 

Rechace H 0 si f < -2.024 o f > 2.204 

2 _ (15 - 1 )(40) 2 + (25 - 1 )(30) 2 
Sp “ 15 + 25-2 

150-180 


= 1 157.89 


í = 


V 1157 ' 89 (^ + ¿) 


-2.699 


Rechace la hipótesis nula. Las medias de las poblaciones son 
distintas. 

55. H 0 : |x d <0 fx d > 0 

Rechace H n si f > 1 .895 


d = 3.11 


s d = 2.91 


-d&*“ 

Rechace H 0 . La media es menor. 

57. H 0 \ jx 0 = (x R , H+ jx 0 A (x fi 
gl = 25 + 28 - 2 = 51 
Rechace H 0 si f < - 2.008 ot> 2.008 
X 0 = 86.24, s 0 = 23.43 
X R = 92.04, s R = 24.12 

2 _ (25 - 1)(23.43) 2 + (28 - 1)(24.12) 2 


25 + 28 -2 
86.24 - 92.04 


566.335 


V 566 - 335 (¿ + ¿) 


= - 0.886 


No rechace H 0 . No hay diferencia entre los números medios de 
automóviles vendidos en las dos concesionarias. 
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59. 


H 0 '- M-f — Me 


Hi : M-f < Ms 

^53.2 2 


gl = 24, calculado por 


15 


+ - 


48. 3‘ 
12 


m m 

14 + 11 

Redondee hacia abajo los grados de libertad. 

Rechace H 0 si f < -2.492. 

39.4 - 187.5 


: 24.546 


í = 


/ (53. 2) 2 

(48. 3) 2 

V 15 

+ 12 


= -7.57 Rechace H 0 . 


61. 


Comenzar con las cinco primeras filas (en contraste con las últimas 
cuatro) disminuye las probabilidades, 
a) jji-] = sin alberca \j. 2 = con alberca 
H 0 : (i-, = p-2 H{. (Xi + n-2 


Rechace H 0 si í > 2.000 o f < -2.000 
X, = 202.8 S-| = 33.7 n 1 = 38 
X 2 = 231.5 s 2 = 50.46 n 2 = 67 

= (38 — 1)(33.7) 2 + (67 — 1)(50.46) 2 = M1 Q5 
p 38 + 67 -2 


202.8 - 231.5 

V 2o4io5 (¿ + ¿) 


-3.12 


Rechace H 0 . No hay diferencia entre los precios medios de 
venta de las casas con y sin alberca. 
b ) |jL-j = sin cochera ¡í 2 = con cochera 

H 0 : (X! = (j-2 H+ n,! A M 2 


Rechace H 0 si í > 2.000 o f < -2.000 
a = 0.05 — 34 + 71 — 2 — 103 

X, = 185.45 s, = 28.00 
X 2 = 238.18 s 2 = 44.88 

2 _ (34 - 1)(28.00) 2 + (71 - 1)(44.88) 2 


= 1 620.07 


185.45 - 238.18 


-6.28 


Rechace H 0 . Hay diferencia entre los precios medios de venta 
de las casas con y sin cochera, 
c) H 0 : — M 2 W+ Mi A jx 2 


Rechace H 0 si í > 2.036 o f < -2.036 


X 2 


196.91 s, = 35.78 n, = 15 

227.45 s 2 = 44.19 n 2 = 20 

2 _ (15 - 1)(35.78) 2 + (20 - 1)(44.19) 2 
Sp ~ 15 + 20-2 


= 1 667.43 


196.91 227.45 _ _ 2 , g 

V 1 667 - 43 (¿ + ¿) 

Rechace H 0 . Hay diferencia entre los precios medios de venta 
de las casas en el barrio 1 y el barrio 2. 

d) H q. — 7T 2 H ^ . TT^ -f- TT 2 

Si z no se encuentra entre - 1 .96 y 1 .96, rechace H 0 . 


24 + 43 „„„ 

Pc ~ 52 + 53 " °' 64 
0.462 - 0.811 

Z “ V0.64 X 0.36/52 + 0.64 X 0.36/53 

Rechace la hipótesis nula. Hay una diferencia. 
63. H qI |a-| — |a 2 H ^ jj. ^ + p_2 

Rechace H 0 si í no está entre -1 .991 y 1 .991 . 

(53 - 1)(52.9) 2 + (27 - 1)(55.1) : 


= -3.73 


s 2 = 


53 + 27 


= 2 878 


454.8 - 441.5 



1.05 


No rechace H 0 . Puede no haber diferencia en el costo medio de 
mantenimiento entre los dos tipos de autobuses. 


CAPITULO 12 

1. 9.01 , del apéndice B. 4 

3. Rechace H 0 si F > 1 0.5, donde los grados de libertad en el 
numerador son 7 y 5 en el denominador. F = 2.04, calculada 
mediante: 


5. 


¡1 (10) 

4 V? 


No rechace H„. No hay una diferencia entre las variaciones de las 
dos poblaciones. 

H 0 : <t 2 — O2 H,: irj / <r 2 

Rechace H 0 donde F> 3.10 (3.10 se encuentra casi a la mitad entre 
3.1 4 y 3.07). F = 1 .44, calculada mediante: 


( 12) 2 

(10) 2 


1.44 


No rechace H 0 . No hay diferencia entre las variaciones de las dos 
poblaciones. 

7. a) H 0 : m-t = (x 2 = ix 3 ; H,: No todas las medias de tratamiento son 
iguales. 

b) Rechace H 0 si F > 4.26 


Fuente 

SS 

9l 

MS 

F 

Tratamiento 

62.17 

2 

31.08 

21.94 

Error 

12.75 

9 

1.42 


Total 

74.92 

11 




e) Rechace H 0 . No todas las medias de tratamiento son iguales. 
9. H 0 : |x, = (x 2 = (x 3 ; H+ No todas las medias de tratamiento son 
¡guales. Rechace H 0 si F > 4.26. 


Fuente 

SS 

9l 

MS 

F 

Tratamiento 

276.50 

2 

138.25 

14.18 

Error 

87.75 

9 

9.75 



Rechace H 0 . No todas las medias de tratamiento son iguales. 

11. a) H 0 : jxt = jx 2 = |x 3 ; H+ No todas las medias de tratamiento son 
iguales. 

b) Rechace H 0 si F > 4.26 

c) SST = 1 07.20, SSE = 9.47, SS total = 1 1 6.67. 


Fuente 

SS 

91 

MS 

F 

Tratamiento 

107.20 

2 

53.600 

50.96 

Error 

9.47 

9 

1.052 


Total 

116.67 

11 




e) Como 50.96 > 4.26. Se rechaza H 0 . Al menos una de las 
medias difiere. 

f) (X, - X 2 ) ± fVMSEÍl/n, + 1/n 2 ) 

= (9.667 - 2.20) ± 2.262 Vi .052(1/3 + 1/5) 

= 7.467 ± 1.69 
= [5.777, 9.157] 

Sí, puede concluir que los tratamientos 1 y 2 tienen medias 
diferentes. 

13. H 0 : |x, = |x 2 = |x 3 = rx 4 ; H+ No todas las medias son iguales. 

Se rechaza H 0 si F > 3.71 . 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

32.33 

3 

10.77 

2.36 

Error 

45.67 

10 

4.567 


Total 

78.00 

13 
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Como 2.36 es menor que 3.71, no se rechaza H 0 . No hay diferencia 
entre los números medios de semanas. 

15. a) H 0 : ¡jl, = |x 2 ; H-¡: No todas las medias de tratamiento son 
iguales. 

b) Rechace H 0 si F > 1 8.5 

c) H 0 : m = m -2 = m- 3 í Wi: No todas las medias de bloqueo son 
iguales. 

Se rechaza H 0 si F > 1 9.0 

d) SS total = (46.0 - 36.5) 2 + ■ ■ ■ + (35 - 36.5) 2 = 289.5 
SSE = (46 - 42.3333) 2 + ■ • ■ + (35 - 30.6667) 2 

= 85.3333 

SST = 289.5 - 85.3333 = 204.1667 
SSB = 2(38.5 - 36. 5) 2 + 2(31.5 - 36.5) 2 + 

2(39.5 - 36. 5) 2 = 8 + 50 + 18 = 76 
SSE = 289.50 - 204.1667 - 76 = 9.3333 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

204.167 

i 

204.167 

43.75 

Bloques 

76.000 

2 

38.000 

8.14 

Errar 

9.333 

2 

4.667 


Total 

289.5000 

5 




f) 43.75 > 1 8.5, por lo tanto, rechace H 0 . Hay una diferencia entre 
los tratamientos. 8.14 < 19.0, por lo tanto, no rechace H 0 
para los bloques. No hay diferencia entre los bloques. 

17. Para tratamiento: Para bloques: 

Ho- M-1 = M-2 = M-3 Hq. m = p. 2 = (X 3 = M-4 = (¿5 

H 1 : No todas las medias H-¡ : No todas las medias 
son iguales son ¡guales 

Rechace si F > 4.46 Rechace si F > 3.84 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

62.53 

2 

31.2650 

5.75 

Bloques 

33.73 

4 

8.4325 

1.55 

Error 

43.47 

8 

5.4338 


Total 

139.73 





Hay una diferencia entre los turnos, no entre empleados. 


Fuente 

SS 

gi 

MS 

F 

P 

Tamaño 

156.333 

2 

78.1667 

1.98 

0.180 

Peso 

98.000 

1 

98.000 

2.48 

0.141 

Interacción 

36.333 

2 

18.1667 

0.46 

0.642 

Error 

473.333 

12 

39.444 



Total 

764.000 

17 





a) Como el valor p (0.18) es mayor a 0.05, no hay diferencia entre 
las medias del tamaño. 

b) El valor p de Peso (0.141 ) también es mayor que 0.05. Por lo 
tanto, no hay diferencia entre esas medias. 

c) No existe una interacción significativa porque el valor p (0.642) 
es mayor a 0.05. 

21 ■ a ) Gráfica de interacción (medias de datos) de ventas 



Sí, parece haber un efecto de interacción. Las ventas son diferentes 
con base en la posición de la máquina, ya sea en la posición dentro 
o fuera. 

b) 


ANOVA de dos vías: ventas contra posición, máquina 

Fuente 

gi 

SS 

MS 

F 

P 

Posición 

i 

104.167 

104.167 

9.12 

0.007 

Máquina 

2 

16.333 

8.167 

0.72 

0.502 

Interacción 

2 

457.333 

228.667 

20.03 

0.000 

Error 

18 

205.500 

11.417 



Total 

23 

783.333 





La posición y la interacción de la posición y los efectos de la 
máquina son relevantes. El efecto de la máquina en las ventas no 
es importante. 


ANOVA de una vía: Ventas contra posición D-320 

Fuente 

gi 

ss 

MS 

F P 

Posición 

i 

364.50 

364.50 

40.88 0.001 

Errar 

6 

53.50 

8.92 


Total 

7 

418.00 



ANOVA de una vía: Ventas contra posición J-1 000 

Fuente 

gi 

SS 

MS 

F P 

Posición 

i 

84.5 

84.5 

5.83 0.052 

Error 

6 

87.0 

14.5 


Total 

7 

171.5 



ANOVA de una via: Ventas contra posición UV-57 

Fuente 

gi 

SS 

MS 

F P 

Posición 

i 

112.5 

112.5 

10.38 0.018 

Error 

6 

65.0 

10.8 


Total 

7 

177.5 




23. 


25. 


Recomendaciones utilizando los resultados estadísticos y las 
ventas medias graficadas en el inciso a): posicione la máquina 
D-320 fuera. De manera estadística, la posición de J-1 000 no 
importa. Posicione la máquina UV-57 dentro. 

H 0 : trf (j 2 ; Hi: rr 2 > af. gl-\ = 21 — 1 = 20; 
gr / 2 = 18 — 1 = 17. Se rechaza H 0 si F > 3.16. 


(45 600) 
(21 330) 2 


Rechace H 0 . Hay más variación entre los precios de venta de las 
casas con frente al mar. 

Sharkey: n = 7 s s = 14.79 

White: n = 8 s w = 22.95 

H 0 : o- 2 £ o- 2 ; <r 2 > crf. gl s = 7 - 1 = 6; 

gl w = 8-1=7 Rechace H 0 si F > 8.26. 


(22.95) 

(14.79) 2 


No puede rechazar H 0 . No hay diferencia entre las variaciones de 
las ventas mensuales. 

27. a) H 0 : m = |i 2 = Fkj = P 4 

H-¡: No todas las medias de tratamiento son iguales. 
b) a = .05 Rechace H 0 si F> 3.10. 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

50 

4-1=3 

50/3 

1.67 

Error 

200 

24 - 4 = 20 

10 


Total 

250 

24 - 1 = 23 




d) No rechace H 0 . 
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j-1 000 
Máquina 


uv-57 


29. H 0 : |x 1 = |x 2 = |jl 3 ; H No todas las medias de tratamiento son 
¡guales. 

Se rechaza H 0 si F > 3.89. 


En el caso del automóvil: 

H 0 : (jli = (j -2 = ■ ■ ■ = M- 7 ¡ Wi: El millaje medio no es el mismo. 
Rechace H 0 si F > 3.00. 


Fuente 

SS 

9l 

MS 

F 

Tratamiento 

63.33 

2 

31.667 

13.38 

Error 

28.40 

12 

2.367 


Total 

91.73 

14 




Se rechaza H 0 . Hay una diferencia entre las medias de tratamiento. 
31. H 0 : m = |x 2 = m -3 = |jl 4 ; H-, -. No todas las medias son iguales. 

Se rechaza H 0 si F > 3.1 0. 


Fuente 

SS 

gi 

MS 

F 

Factor 

87.79 

3 

29.26 

9.12 

Error 

64.17 

20 

3.21 


Total 

151.96 

23 




Como la F calculada de 9.12 > 3.10, se rechaza la hipótesis nula de 
que no hay diferencia con ei nivel de 0.05. 

33. a) H 0 : m = |x 2 ; H,: m + \¡. 2 - Valor crítico de F = 4.75. 


Fuente 

SS 

9l 

MS 

F 

Tratamiento 

219.43 

1 

219.43 

23.10 

Error 

114.00 

12 

9.5 


Total 

333.43 

13 





Entonces f 2 = F. Es decir (-4.806) 2 = 23.10. 
c) Se rechaza H 0 . Hay una diferencia entre las calificaciones 
medias. 

35. Se rechaza la hipótesis nula debido a que el estadístico F (8.26) es 
mayor que el valor crítico (5.61) al nivel de significancia 0.01 . El 
valor p (0.0019) también es menor que el nivel de significancia. Los 
rendimientos medios en millas no son iguales. 

37. H 0 : m-i = v -2 = F3 = F4- H i : Al menos una media es diferente. 
Rechace H 0 si F> 2.7395. Como 2.72 es menor a 2.7395, no se 
rechaza H 0 . También puede ver esta conclusión a partir del valor p 
de 0.051 , que es mayor a 0.05. No hay diferencia entre las 
medias de los distintos tipos de correo de primera clase. 

39. Para el color, el valor crítico de Fes 4.76; para el tamaño, es 5.14. 


Fuente 

SS 

9l 

MS 

F 

Tratamiento 

25.0 

3 

8.3333 

5.88 

Bloques 

21.5 

2 

10.75 

7.59 

Error 

8.5 

6 

1.4167 


Total 

55.0 

11 




Las H 0 del tratamiento y los bloques (color y tamaño) se rechazan. 
Al menos una media del color difiere y al menos una media del 
tamaño. 

41 . a) El valor crítico de F es 3.49. La F calculada es 0.688. No 
rechace H 0 . 

b ) El valor crítico de F es 3.26. El valor calculado de F es 1 00.204. 

Rechace H 0 para las medias de los bloques. 

Hay una diferencia entre las casas pero no entre los asesores. 

43. En el caso de la gasolina: 

H 0 : m = /jl 2 = jjl 3 ; H-¡: El millaje medio no es el mismo. 

Rechace H 0 si F > 3.89. 


Tabla ANOVA 

Fuente 

SS 

gi 

MS 

F 

Gasolina 

44.095 

2 

22.048 

26.71 

Autos 

77.238 

6 

12.873 

15.60 

Error 

9.905 

12 

0.825 


Total 

131.238 

20 




Hay una diferencia tanto entre los automóviles como entre la 
gasolina. 

45. H 0 : m = |jl 2 = jjl 3 = n, 4 = (jl 5 = |x 6 ; H-¡: Las medias de tratamiento 
no son ¡guales. Rechace H 0 si F > 2.37. 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

0.03478 

5 

0.00696 

3.86 

Error 

0.10439 

58 

0.0018 


Total 

0.13917 

63 




Se rechaza H 0 . Hay una diferencia entre las ponderaciones medias 
de los colores. 

47. a) 

Gráfica de interacción (medias de datos) del salario 



Sector 

b) ANOVA de dos vías: Salarlo contra género, sector 


Fuente 

GL 

SS 

MS 

F 

P 

Género 

1 

44086 

44086 

11.44 

0 . 004 

Sector 

1 

156468 

156468 

40 . 61 

0 . 000 

Interacción 

1 

14851 

14851 

3 . 85 

0 . 067 

Error 

16 

61640 

3853 



Total 

19 

277046 





No hay efecto de interacción del género y el sector en los salarios. 
Sin embargo, hay diferencias relevantes entre los salarios medios 
con base en el género y diferencias significativas entre los salarios 
medios con base en el sector. 


823 



ANOVA de 

una 

vía: salario contra sector 


Fuente 

GL 

SS 

MS F 

P 

Sector 

1 

156468 

156468 23.36 

0 . 000 

Error 

18 

120578 

6699 


Total 

19 

277046 




s = 81.85 R-Sq = 56.48% R-Sq(adj) = 54.06% 


Nivel 

N 

Mean 

StDev 

Individual 95% CIs para la media basada 
en la desviación estándar agrupada 

Privado 

10 

1175.2 

95 . 9 

( * ) 

Público 

10 

998.3 

64 . 8 

< * > 

ANOVA de 

una 

960 1040 1120 1200 

vía: salario contra sector 

Fuente 

GL 

SS 

MS 

F P 

Género 

1 

44086 

44086 

3.41 0.081 

Error 

18 

232960 

12942 


Total 

s = 113. 

19 

, 8 R- 

277046 

-Sq = 15. 

.91% R- 

Sq (adj ) = 11.24% 

Nivel 

N 

Mean 

StDev 

Individual 95% CIs para la media basada 
en la desviación estándar agrupada 

Hombres 

10 

1133.7 

137.9 

( * ) 

Muj eres 

10 

1039 . 8 

82 . 9 

( * > 




980 1050 1120 1190 


49. 


d) Los resultados estadísticos muestran que sólo el sector, 

público o privado, tiene un efecto relevante en los salarios de 
los contadores. 

a) H 0 -.a 2 np = t Tp H,: o% p # a 2 p . 

Rechace H 0 si F > 2.05 (estimado), 
gr/i s= 67 — 1 = 66; gl 2 = 38 - 1 = 37. 


(50.57) 
(33.71 ) 2 


b) 


Rechace H 0 . Hay una diferencia entre las varianzas de los 
precios de venta. 

Hq. a 2 g = cftg-, H^.a 2 g i= a 2 g . 

Rechace H 0 si F> 2.21 (estimado). 


(44.88) 

(28 mj 2 


Rechace H 0 . Hay una diferencia entre las varianzas de los dos 
precios de venta. 


Fuente 

SS 

gi 

MS 

F 

Colonia 

13 263 

4 

3 316 

1.52 

Error 

217 505 

100 

2175 


Total 

230 768 

104 




H 0 : m-i = u -2 = M -3 = m -4 = mí H-¡: No todas las medias de 
tratamiento son iguales. Rechace H 0 si F> 2.46. 

No rechace H 0 . No hay una diferencia entre los precios de 
venta medios en los cinco municipios. 

51. a) Hq. m = \í , 2 = M -3 H-¡: Las medias de tratamiento no son 

iguales. Rechace H 0 si F > 4.89. 


Fuente 

SS 

gi 

MS 

F 

Tratamiento 

28 996 

2 

14 498 

5.62 

Error 

198 696 

77 

2 580 


Total 

227 692 

79 




b) Hq. M-i = M -2 = ^3 H i : Las medias de tratamiento no son 
¡guales. Rechace H 0 si F > 3.12. 


Fuente 

SS 

gi 

MS F 

Tratamiento 

5 095 

2 

2 547 1.45 

Error 

135 513 

77 

1 760 

Total 

140 608 

79 



No rechace H 0 Las millas medias recorridas no son diferentes, 
c) (441.81 — 506.75) ± 1.991 

Esto se reduce a -64.94 ± 38.68, así que la diferencia está 
entre -103.62 y -26.26. En otras palabras, Bluebird es menos 
costoso que Thompson por una cantidad entre $26.26 y 
$103.62. 



CAPITULO 13 

1. 2(X - X)(Y - Y) = 10.6, s x 


: 2.7019, s v = 1.3038 


10.6 


3. a) Ventas. 

b) y 


(5 - 1)(2.7019)(1 .3038) 


= 0.7522 



1 2 3 4 5 6 

Número de anuncios 


Rechace H 0 Las millas medias recorridas no son diferentes. 
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17. a) 


c) 2(X - X)(Y - Y) = 36, n = 5, s* = 1 .581 1 , 
s y = 6.1237 

36 

r = = O 9295 

(5 — 1)(1 .581 1)(6.1237) 

d) Hay una fuerte asociación positiva entre las variables. 

a) Policía es la variable independiente y delitos es la dependiente. 

b) 

18.0 I- * 


i 12.0 

CD 

O 

6.0 


12.0 16.0 20.0 24.0 28.0 

Policía 


c) n = 8, £(X - X)(Y" - Y) = -231 .75, 
s„ = 5.8737, Sy = 6.4462 

-231.75 


-0.8744 


(8 - 1 )(5 . 8737)(6 . 4462) 
d) Relación inversa fuerte. Conforme aumenta el número de 
policías disminuyen los delitos. 

Rechace H n si f > 1.812 


.32V12 - 2 

f = . = 1.068 

Vi - (,32) 2 

No rechace H 0 . 

9. H 0 :p<0;H,:p> 0. Rechace H 0 si f > 2.552. gl = 18. 

.78V20 - 2 


t = 


= 5.288 


Vi - (,78) 2 

Rechace H 0 . Hay una correlación positiva entre los galones 
vendidos y el precio. 

11. H 0 : p<0 H,: p > 0 

Rechace H 0 si t > 2.650 


0.667 Vi 5 - 2 
f = . = 3.228 

Vi - 0.667 2 

Rechace H 0 . Hay una correlación positiva entre el número de 
pasajeros y el peso del avión. 

13. a) Y = 3.7778 + 0.3630X 


( 1 .3038 \ 

b = 0.7522 — — — = 0. 
\2.7019/ 


3630 


a = 5.8 - 0.3630(5.6) = 3.7671 
b) 6.3081, determinado por Y = 3.7671 + 0.3630(7) 
15. a) 2(X - X)(Y- Y) = 44.6, s* = 2.726, s y = 2.011 

44.6 


(10 - 1)(2.726)(2.01 1) 

b = .904^) = 0.667 
V2.726 J 

a = 7.4 - .677(9.1) = 1.333 
b) Y = 1 .333 + .667(6) = 5.335 


= .904 


10 


5 - 


0 10 20 30 40 50 60 70 80 90 
Ventas 

b) 2(X - X)(Y -Y) = 629.64, s„ = 26.17, s y = 3.248 

629.64 „„„ 

r = = .6734 

(12 - 1)(26.17)(3.248) 

3.248 


= 1.8507 


C) fa = ' 6734 l2M70j= 00836 

64.1 7501.10 

a = — - 0.0836Í — 


d) Y = 1.8507 + 0.0836(50.0) = 6.0307 (millones de dólares) 
( 6.4462 \ 

19. a) b = -.8744 ) = -0.9596 


29.3877 


5.8737 

95 /146\ 

a = — - (—0.9596)1 I = 


8 ' V 8 / 

b) 10.1957, determinado mediante 29.3877 - 0.9596(20) 

c) Por cada policía adicional, los delitos disminuyen en casi uno. 

21. H 0 :|3> 0 H-,: p < 0 gl = n - 2 = 8-2 = 6 

Rechace H 0 si t = < -1 .943 

t = -0.96/0.22 = -4.364 

Rechace H 0 y concluya que la pendiente es distinta a cero. 

23. H 0 : p = 0 H{. p + 0 gl = n - 2 = 12-2 = 10 

Rechace H 0 si í no está entre -2.228 y 2.228 

t = 0.08/0.03 = 2.667 

Rechace H 0 , y concluya que la pendiente es distinta a cero. 


68.4877 


25. El error estándar de estimación es 0.913, calculado por . , 

V 8-2 

El coeficiente de determinación es 0.76, calculado por (-0.874) 2 . 
76% de la variación en los delitos puede explicarse por la variación 
en los policías. 

/ 6.667 

27. El error estándar de estimación es 0.91 3, calculado por J — — — . 

El coeficiente de determinación es 0.82, calculado por 29.733/36.4. 
82% de la variación en las horas-kilovatio puede explicarse por la 
variación en el número de habitaciones. 

, 1 000 

29 - a) ^ = T500 = - 6667 
b) r= V.6667 = .8165 
500 


C) Syj, = ■ 


= 6.2017 


31. a) 6.308 ± (3.182)(.993),/ .2 + 


(7 - 5.6) 2 


29.2 


= 6.308 ± 1.633 
= [4.675, 7.941] 

b) 6.308 ± (3.182)(.993)\ 1 + 1/5 + .0671 
= [2.751, 9.865] 


825 


33. a) 4.2939,6.3721 
b) 2.9854,7.6806 

35. La correlación entre las dos variables es 0.298. Elevando al 
cuadrado X, la correlación aumenta a 0.998. 

37. H 0 : p < 0; H,: p > 0. Rechace H 0 si f > 1 .714. 


f : 


.94V25 - 2 


= 13.213 


39. 


Vi - (,94 ) 2 

Rechace H 0 . Hay una correlación positiva entre pasajeros y el peso 
del equipaje. 

H„. p < 0; Hy p > 0. Rechace H 0 si f > 2.764. 


t = 


.47Vl2 - 2 


= 1 .684 


Vi - (,47 ) 2 

No rechace H 0 . No hay una correlación positiva entre el tamaño del 
motor y el desempeño. El valor p es mayor que 0.05, pero menor 
que 0 . 10 . 

41. a) El número total de automóviles vendidos disminuye conforme 
disminuye el porcentaje de acciones del mercado. La relación 
es Inversa tal que cuando una aumenta, la otra disminuye. 


b) r = 


-305.19 


■ = -0.881 


(12 - 1 )(3.849)(8. 1 85) 

El valor r Indica una relación inversa muy fuerte entre las 
variables. 

H 0 : p > 0 H{. p < 0 

Rechace H„ si f < -2.764 


-0.881X12-2 
t — — , =~ — — 5.89 

Vi - ( — 0.881 ) 2 

Rechace H 0 . Hay una correlación negativa. 
d ) 77.6%, calculado por (-0.8881) 2 , de la variación en la 

participación del mercado está representado por la variación en 
los autos vendidos. 

43. a) r = 589 

b) i 2 = (0.589) 2 = 0.3469 

c) H 0 : p < 0; p > 0. Rechace H 0 si t > 1.860. 


45. a) 


0.589 VlO - 2 


= 2.062 


Vi - (,589) 2 

Se rechaza H 0 . Hay una asociación positiva entre el tamaño de 
la familia y la cantidad que gasta en alimentos. 

12 



6 8 
Meses 


Hay una relación inversa entre las variables. Conforme 
aumentan los meses de posesión, el número de horas de 
ejercicio disminuye. 

b) r = -8.827 

c) H 0 : p > 0; p < 0. Rechace H 0 si f < -2.896. 


47. a) 


-0.827V10 - 2 
Vi - (-0.827) 2 


-4.16 


Rechace H 0 . Hay una asociación negativa entre los meses en 
posesión y las horas ejercitadas. 

La edad mediana y la población están directamente 
relacionadas. 


b) r 


11.93418 

(10 - 1)(2.207)(1 .330) 


0.452 


c) La pendiente de 0.272 indica que por cada incremento de un 
millón en la población, la edad mediana aumenta 0.272 años en 
promedio. 


d) 

e) 


f) 


La edad mediana es 32.08 años, calculado por 31 .4 + 
0.272(2.5). 

El valor p (0.1 90) de la variable población es mayor que, 
digamos, 0.05. No se puede rechazar una prueba de 
significancia de dicho coeficiente. En otras palabras, es posible 
que el coeficiente de la población sea cero. 

H 0 : p = 0 H{. p # 0 Rechace H 0 si f no está entre -2.306 y 
2.306, 

0.452 VlO - 2 

gl = 8 t = — , =- = 1 .433 No rechace H„. 

y VI - (0.452) 2 0 


Puede no haber relación entre la edad y la población. 

49. a) b = -0.4667, a = 11.2358 

b) Y = 11 .2358 - 0.4667(7.0) = 7.9689 

I 1 (7 - 7.1 333) 2 

c) 7.9689 ± (2.160X1.114)^1 + - + L_ 73 _V 

= 7.9689 ± 2.4854 
= [5.4835, 10.4543] 

d) r 2 = 0.499. Casi 50% de la variación en la cantidad de la 
licitación se explica por el número de los licitadores. 



b) 


Parece haber una relación entre las dos variables. Conforme 
aumenta la distancia, también lo hace el tiempo de embarque. 
r = 0.692. 

H 0 : p < 0; Hy p > 0. Rechace H 0 si f > 1.734. 


0.692V20 - 2 
Vi - (0.692) 2 


4.067 


Se rechaza H 0 . Hay una asociación positiva entre la distancia de 
embarque y el tiempo de envío. 

c) r 2 = 0.479. Casi la mitad de la variación en el tiempo de envío 
se explica por la distancia de embarque. 

d) S y . x = 1 .987 
53. a) b = 2.41 

a = 26.8 

La ecuación de regresión es: Precio = 26.8 + 2.41 x Dividendo. 
Por cada dólar adicional de dividendo, el precio aumenta $2.41 . 
, 5 057.6 

5 ) r 2 = = 0.658 Por lo tanto, 65.8% de la variación 


55. 


del precio se explica por el dividendo. 
r=V658 = 0.811 H 0 : p < 0 H,: p > 0 

A un nivel de significancia de 5%, rechace H 0 cuando t > 1 .701 . 
0.811 V30 - 2 


t = 


= 7.34 


Vi - (0.81 1) 2 

Por lo tanto, se rechaza H 0 . La correlación de la población es 
positiva. 

35 

s y . x = V29 778 406 = 5 456.96 


13 548 662 082 


14 531 349 474 


= 0.932 


826 


r = Vo.932 = 0.966 

H 0 : p < 0, H,: p > 0; Rechace H 0 si f > 1.692. 

.966\/ 35-2 


t = 


= 21.46 


57. 


Vi - (,966) 2 

Rechace H 0 . Hay una relación directa entre el tamaño de la casa 
y su valor de mercado. 

La ecuación de regresión es Precio = -773 + 1 ,048 Velocidad. 
La segunda computadora portátil (1 .6, 992) tiene un residuo de 
-557.60, es decir, cuesta $557.60 por debajo del precio 
pronosticado. Es una “oferta” notable. 

La correlación de Velocidad y Precio es 0.835. 

H 0 :p<D H, : p > 0 Rechace H 0 si f > 1 .81 25. 

0.835 Vi 2 - 2 


Para ERA: H 0 : p > 0 Hy p < 0 

A nivel de 5%, rechace H 0 si f < -1.701 
-0.635 V30 - 2 


f : 


= -4.35 


f = 


4.799 


Vi - (0.835) 2 
Rechace H 0 . Es razonable decir que la correlación de la 
población es positiva. 

59. a) r — .987, H 0 : p < 0, Hy p > 0. Rechace H 0 si t > 1 .746. 

.987 Vi 8 - 2 


f = 


= 24.564 


61. 


63. 


Vi - (,987) 2 

b) Y = -29.7 + 22.93X; una taza adicional aumenta el peso del 
perro casi 23 libras. 

c) El perro número 4 come demasiado. 

La correlación de Taquilla y Presupuesto Ajustado es 0.027. 

H 0 \ p < 0 Hy p > 0 
A un nivel de 5%, rechace H 0 si f > 1 .677 

q 0 27v^2 = oi87 
v 1 - (0.027) 2 

No rechace H 0 . La correlación de la población no necesariamente 
es positiva. 

Las películas de “gran presupuesto” no siempre se traducen en 
grandes ganancias en taquilla. 

a) Parece haber una relación directa entre las variables. 

Trazo de recta ajustada 
Victorias = 67.12 + 0.1568 Salario 



b) 

c) 

d) 


e) 

f) 


Salario 

82.8, calculado por 67.12 + 0.1568 x 100 
0.78, calculado por 0.1568(5) 


Vi - (-0.635) 2 
Rechace H 0 . La correlación de ERA es negativa. 

CAPÍTULO 14 

1. a) Ecuación de regresión múltiple 
La intercepción Y 

Y = 64 100 + 0.394(796 000) + 9.6(6 940) 

- 1 1 600(6.0) = $374 748 

497.736 determinado mediante 

Y = 16.24 + 0.017(18) 

+ 0.0028(26 500) + 42(3) 

+ 0.0012(156 000) 

+ 0.19(141) + 26.8(2.5) 

Dos actividades sociales más. El ingreso sólo agregó 28 al 
índice; las actividades sociales agregaron 53.6. 

SSE / 583.693 

s y-i2 : 


b ) 

c) 

3. a) 


b) 


5. a) 


n — (k + 1) 
= V9.414 = 3.068 


65 - (2 + 1) 


b) R 


c) R'¡ 


.118 


95% de los residuos estarán entre ±6.136, determinado 
mediante 2(3.068) 

SSR _ 77.907 
SS total ~ 661 .6 
Las variables independientes explican 1 1 .8% de la variación. 
SSE 583.693 

n - (k + 1) 65 - (2 + 1) 

adi ^ ' 


1 


SS total 
n - 1 


= 1 - 


661.6 
65 - 1 
9.414 


= 1 - 


10.3375 


1 - .911 = .089 


7. 


9. 


a) Y = 84.998 + 2.391X, - 0.4086X 2 

b) 90.0674, determinado mediante Y = 84.998 + 2.391(4) - 
0.4086(11) 

c) n = 65 y k = 2 

d) H 0 \ p-, = p 2 = 0 Hy No todas las p son cero 
Rechace H 0 si F > 3. 1 5 

F = 4.14, rechace H 0 . No todos los coeficientes de regresión 
netos son ¡guales a cero. 

e) Para X-, Para X 2 

Ro' Pi — 0 H 0 : p 2 = 0 

Hy PtAO Hy P 2 A0 

f = 1 .99 f = —2.38 

Rechace H 0 si f > 2.0 o bien t < -2.0 
Elimine la variable 1 y mantenga la 2. 

f) El análisis de regresión se debe repetir sólo con X 2 como 
variable independiente. 

a) La ecuación de regresión es: Desempeño = 29.3 + 5.22 Aptitud 
+ 22.1 Sindicato 


Hq. P < 0 H,:P>0 gl = n - 2 = 30 - 2 = 28 

Predictor 

Coef SE 

Coef 

T 

P 

Rechace H 0 si f > 1.701 f = 0.1568/0.0564 = 2.78 

Constant 

29.28 

12 . 77 

2.29 

0 . 041 

Rechace H 0 y concluya que la pendiente es positiva. 

Aptitude 

5.222 

1 . 702 

3 . 07 

0 . 010 

0.216 o 21.6%, calculado por 819/3 792 

Union 

22 . 135 

8 . 852 

2 . 50 

0 . 028 

La correlación entre victorias y promedio de bateo es 0.467. La 






correlación entre victorias y ERA es -0.635. ERA es la más 

S = 16.9166 R- 

Sq = 53.3% 

R-Sq 

(adj ) 

= 45.5 

fuerte. 

Analysis of Variance 




Para el promedio de bateo: H 0 : p < 0 Hy p > 0 

Source 

DF SS 

MS 

F 

P 

A nivel de 5%, rechace H 0 si f > 1 .701 . 

Regression 

2 3919.3 

1959 . 6 

6 . 85 

0 . 010 

0.467 V30 - 2 

Residual Error 

12 3434.0 

286.2 



t = — 7 = 2.795 

Total 

14 7353.3 




Vi - (0.467) 2 






Rechace H 0 . La correlación del promedio de bateo es positiva. 

b) Estas variables son eficaces para predecir el desempeño. 


Explican 53.3% de la variación en el desempeño. En particular, 
los miembros de un sindicato aumentan 22.1 el desempeño 
típico. 
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c) H 0 : (J 2 = O Hf'. p 2 ^ O 

Rechace H 0 si f < -2.179 o bien f > 2.179. 

Como 2.50 es mayor que 2.179, rechace la hipótesis nula y 
concluya que la membresía del sindicato es relevante y se debe 
incluir. 

d) Cuando usted considera la variable interacción, la ecuación de 
regresión es Desempeño = 38.7 + 3.80 Aptitud - 0.1 Sindicato 
+ 3.61 XiX 2 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

38.69 

15 . 62 

2.48 

0.031 

Aptitude 

3 . 802 

2 . 179 

1 . 74 

0 . 109 

Union 

0 

H 

0 

1 

23 . 14 

0 

0 

0 

1 

0 . 997 

* 1*2 

3 . 610 

3.473 

1 . 04 

0.321 


El valor correspondiente al término Interacción es 1 .04. Esto no 
es relevante. Por lo tanto, concluya que no hay Interacción entre 
aptitud y membresía en sindicato cuando se predice el 
desempeño laboral. 

11. a) La ecuación de regresión es 

Precio = 3 080 - 54.2 Licltadores + 1 6.3 Edad 

Predictor Coef SE Coef T P 

Constant 3080.1 343.9 8 . 9G 0.000 

Bidders -54.19 12.28 -4.41 0.000 

Age 16.289 3.784 4.30 0.000 


El precio disminuye 54.2 conforme participa un licitador 
adicional. En tanto que el precio aumenta 16.3 conforme la 
pintura envejece. ¡Aunque uno podría esperar que las pinturas 
antiguas valgan más, es inesperado que el precio disminuya 
conforme participen más llcitadores! 

b) La ecuación de regresión es 

Precio = 3 972 - 1 85 Licitadores + 6.35 Edad + 1 .46 X-,X 2 


Predictor 

Coef 

SE Coef T P 

Constant 

3971 . 7 

850.2 4.67 0.000 

Bidders 

-185 . 0 

114.9 -1.61 0.122 

Age 

6.353 

9.455 0.67 0.509 

* 1*2 

1.462 

1.277 1.15 0.265 

El valor t correspondiente al término interacción es 1 .1 5. Esto 
no es relevante. Por lo tanto, concluya que no hay Interacción. 
En el procedimiento por pasos, el número de licltadores Ingresa 
primero a la ecuación. Luego ingresa el término interacción. La 
variable edad no se debe Incluir ya que no es significativa. 
Respuesta es Precio en 3 factores de predicción, con N = 25. 

Step 

1 

2 

Constant 

4 , 507 

4, 540 

Bidders 

-57 

-256 

T-Value 

-3.53 

-5.59 

P-Value 

0 . 002 

0.000 

* 1*2 


2.25 

T-Value 


4.49 

P-Value 


0.000 

S 

295 

218 

R-Sq 

35 . 11 

66 . 14 

R-Sq (adj ) 

32.29 

63 . 06 


13. 


n = 40 
4 


750 
1 250 


= .60 


d) Sy . 12 3 4 = V500/35 = 3.7796 


e ) H 0 -, p 1 — p 2 — P3 — P 4 — 0 

H 1 : No todas las p son iguales a cero. 


15. 


17. 


H 0 se rechaza si F > 2.65. 


750/4 

500/35 


13.125 


a) 

b) 

c) 

d ) 


e) 

a) 

b) 


Se rechaza H 0 . Al menos una p, no es igual a cero. 
n = 26 

R 2 = 100/140 = .7143 
1.4142, calculado por \Í2 


Ha- Pi = P 2 = P 3 = P 4 = Ps = 0 

/+,: No todas las p son 0. 

Hq. se rechaza si F > 2.71 . 

F = 10.0 calculada. Rechace H 0 . Al menos un coeficiente de 
regresión no es cero. 

H 0 se rechaza en cada caso si f < -2.086 o bien f > 2.086. Se 
deben eliminar X 1 yX 2 . 


$28 000 
r , SSR 
SS total 


3 050 
5 250 


= .5809 


19. 


c) 9.199, determinado mediante V84.62 

d) Se rechaza H 0 si F > 2.97 (aproximadamente) 

1 016.67 

F calculada = = 12.01 

84.62 


e) 


a) 


b) 


Se rechaza H 0 . Al menos un coeficiente de regresión no es cero. 
Si la f calculada está a la derecha de -2.056 o a la derecha de 
2.056, se rechaza la hipótesis nula en cada uno de estos casos. 
La t calculada para X 2 y X 3 sobrepasa el valor crítico. Por lo 
tanto, “población” y “gastos en publicidad” se deben conservar 
y eliminar “número de competidores,” X,. 

La correlación más fuerte es entre GPA y legal. No hay 
problema con multlcolinealidad. 


R 2 


4.3595 

5.0631 


= .8610 


c) 


Se rechaza H 0 si F > 5.41 . 


1 .4532 
0.1407 


10.328 


Al menos un coeficiente no es cero. 


d) Se rechaza cualquier H 0 si f < -2.571 o bien t > 2.571 . Parece 
que sólo GPA es relevante. Se pueden eliminar Verbal y 
Matemáticas. 


e) R 2 


4.2061 

5.0631 


= .8307 


R 2 sólo se ha reducido 0.0303. 

f) Los residuos parecen ligeramente sesgados (positivos), pero 
aceptables. 

g) No parece haber un problema con la gráfica. 

21. a) La matriz de correlación de Pantalla y Precio es 0.893. Así que 
no parece haber una relación lineal entre ambas. 

b) Precio es la variable “dependiente”. 

c) La ecuación de regresión es Precio = -2 484 + 1 01 Pantalla. 
Por cada pulgada de aumento de tamaño de la pantalla, el 
precio se eleva $101 en promedio. 

d) Usando variables indicadoras “ficticias” para Sharp y Sony, la 
ecuación de regresión es Precio = -2308 + 94.1 Pantalla + 15 
fabricante Sharp + 381 fabricante Sony. Sharp puede obtener, 
en promedio, $15 más que Samsung, y Sony puede obtener 
una ganancia adicional de $381 más que Samsung. 

e) A continuación, una parte de la salida: 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

-2308.2 

492 . 0 

-4 . 69 

0 .000 

Screen 

94 . 12 

10 . 83 

8.69 

0.000 

Manufacturer Sharp 

15 . 1 

171 . 6 

0.09 

0.931 

Manufacturer Sony 

381.4 

168 . 8 

2.26 

0 . 036 
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Ventas 


El valor p de Sharp es relativamente grande. No puede 
rechazarse una prueba de su coeficiente. Eso significa que 
puede no tener una ventaja real sobre Samsung. Por otra parte, 
el valor p del coeficiente de Sony es bastante pequeño. Eso 
indica que no ocurrió por azar, y que existe cierta ventaja real de 
Sony sobre Samsung. 

/) Un histograma de los residuos indica que siguen una 
distribución normal. 

g) La variación residual puede estar aumentando para valores 
ajustados más grandes. 

23. a) 

Diagrama de dispersión de Ventas contra Publicidad, Cuentas, Competidores, Potencial 


Publicidad 

Cuentas 

• • 

• * 

• • • 

. . . * - 

• 5 # • 


2 4 6 8 

30 40 50 60 70 

Competidores 

Potencial 

* * 

* ' 

• 

• 

• • • 



• • # * . ¡ 

: • • . 

. • • 

• • " 




4 6 8 10 12 5 10 15 20 


Las ventas parecen disminuir con el número de competidores y 
aumentan con el número de cuentas y el potencial. 
b) Correlaciones de Pearson 



Sales 

Advertising 

Accounts 

Competitors 

Advertising 

0.159 




Accounts 

0.783 

0.173 



Competitors 

-0 . 833 

-0.038 

-0.324 


Potential 

0.407 

-0.071 

0.468 

-0.202 


El número de cuentas y el potencial de mercado están 
moderadamente correlacionados, 

c) La ecuación de regresión es: 

Ventas = 178 + 1.81 Publicidad + 3.32 Cuentas - 21.2 
Competidores + 0.325 Potencial 


Predictor 

Coef 

SE 

Coef 


T 


P 

Constant 

178.32 

12 . 96 

13 . 

76 

0. 

000 

Advertising 

1 . 807 

1 

.081 

1 . 

67 

0 . 

109 

Accounts 

3.3178 

0 . 

1629 

20 . 

37 

0 . 

000 

Competitors 

-21 . 1850 

0. 

7879 

-26 . 

89 

0 . 

000 

Potential 

0.3245 

0. 

4678 

0 . 

69 

0 . 

495 

S = 9.60441 

R-Sq = 

98 . 9% 

R-Sq 

(adj ) 

= 

98 

1 . 7% 

Analysis of 

Variance 







Source 

DF 

SS 

MS 


F 


P 

Regression 

4 176777 

44194 

479 

.10 

0 . 

000 


Residual Error 21 1937 92 

Total 25 178714 

El valor F calculado es muy grande. Por lo tanto, puede 
rechazar la hipótesis nula que todos los coeficientes de 
regresión son cero. Concluya que algunas de las variables 
independientes son eficaces en explicar las ventas. 

d ) El potencial de mercado y la publicidad tienen valores p 
grandes (0.495 y 0.109, respectivamente). Probablemente deba 
omitirlas. 

e) Si omite el potencial, la ecuación de regresión es: 

Ventas = 180 + 1.68 Publicidad + 3.37 Cuentas - 21.2 
Competidores 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

179 . 84 

12.62 

14 .25 

0 . 000 

Advertising 

1 . 677 

1 . 052 

1.59 

0 . 125 

Accounts 

3.3694 

0 . 1432 

23.52 

0 . 000 

Competitors 

-21.2165 

0 . 7773 

-27.30 

0 . 000 


Ahora la publicidad no es importante. Esto también conduciría a 
dejar fuera la variable publicidad y reportar que la ecuación de 
regresión pulida es: 

Ventas = 187 + 3.41 Cuentas - 21.2 Competidores 


Predictor 

Coef 

SE 

Coef 

T 


Constant 

186 . 69 


12.26 

15.23 

0 . 00 

Accounts 

3 .4081 

0 

. 1458 

23.37 

0 . 00 

Competitors 

-21 . 1930 

0 

.8028 

-26.40 

0 . 00 


f) Histograma de los residuos 

(la respuesta es Ventas) 



-20 -10 0 10 20 


Residuo 

El histograma parece ser normal. No hay problemas indicados 
en esta gráfica. 

g) El factor de inflación de la varianza de las dos variables es 1 .1 . 
Son menores que 1 0. No hay problemas ya que este valor 
indica que las variables independientes no están fuertemente 
correlacionadas entre si. 

25. La imagen de la captura de pantalla es la siguiente: 


Predictor 

Coef 

StDev t-ratio 

p 

Constant 

651 . 9 

345.3 

1 . 89 

0 . 071 

Service 

13 .422 

5 . 125 

2.62 

0 . 015 

Age 

-6 . 710 

6.349 

1.06 

0.301 

Gender 

205 . 65 

90.27 

2 .28 

0 . 032 

Job 

-33.45 

89.55 - 

0.37 

0 . 712 

Analysis of Variance 



SOURCE 

DF 

SS MS 

F 

p 

Regression 

4 1066830 266708 

4 . 77 

0 . 005 

Error 

25 1398651 55946 



Total 

29 2465481 




a) Y = 651 .9 + 13.422X, - 6.71 0X 2 + 205.65X 3 - 33.45X 4 

b) R 2 = .433, que es un poco bajo para este tipo de estudio. 

c) H 0 \ Pi = p 2 = P 3 = p 4 = 0; H no todas las x son iguales a 

cero. 

Rechace H 0 si F > 2.76 

1 066 830/4 
~ 1 398 651/25 - ' 

Se rechaza H 0 . No todas las x son iguales a cero. 

d) Usando un nivel de significancia de 0.05, rechace la hipótesis 
de que el coeficiente de regresión es 0 si f < -2.060 o f > 2.060. 
Servicio y género deben permanecer en el análisis; edad y 
empleo pueden ser eliminados. 

e) A continuación se presenta la imagen de la captura de pantalla 
usando las variables independientes servicio y género. 
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Predictor 

Coef StDev t-ratio 

p 

Constant 

784.2 316.8 2.48 

0 . 020 

Service 

9.021 3.106 2.90 

0 . 007 

Gender 

224.41 87.35 2.57 

0 . 016 

Analysis of Variance 


SOURCE 

DF SS MS F 

p 

Regression 

2 998779 499389 9 . 19 

0 . 001 

Error 

27 1466703 54322 


Total 

29 2465481 



Un hombre gana $224 más al mes que una mujer. La diferencia 
entre empleos técnicos y administrativos no es relevante. 

27. a) Y = 29.913 - 5.324X, + 1.449X 2 

b ) EPS es (f = - 3.26, valor p = 0.005). Producción no es (í = 

0.81, valor p = 0.431). 

c) Un aumento de 1 en EPS genera una disminución de 5.324 en 
P/E. 

d) El número 2 de acciones está devaluada. 

e) La siguiente es una gráfica residual. No parece seguir la 
distribución normal. 



f ) No parece haber problema con la gráfica de los residuos contra 
los valores ajustados. 



g) La correlación entre producción y EPS no es un problema. No 
hay problema con la multlcolinealidad. 



P/E 

EPS 

EPS 

-0.602 


Producción 

.054 

.162 


29. a) La ecuación de regresión es 

Ventas (000) = 1 .02 + 0.0829 Infomerciales 
Predictor Coef SE Coef T P 

Constant 1.0188 0.3105 3.28 0.006 

Inf ormericals 0.08291 0.01680 4.94 0.000 

Analysis of Variance 

Source DF SS MS F P 

Regression 1 2.3214 2.3214 24.36 0.000 

Residual Error 13 1.2386 0.0953 

Total 14 3.5600 

La prueba global demuestra que hay una relación entre ventas y 
el número de ¡nformerciales. 

b ) Histograma de RESI1 



RESI1 

Los residuos parecen seguir la distribución normal. 

31. a) La ecuación de regresión es 

Precio en la subasta =-118 929 + 1 .63 Préstamo + 2.1 Pago 
mensual + 50 Pagos realizados 


Analysis of 

Variance 


Source 

DF 

SS 

MS 

Regression 

Residual 

3 

5966725061 

1988908354 

Error 

16 

798944439 

49934027 

Total 

19 

6765669500 



La F calculada es 39.83. Es mucho mayor que el valor crítico 
3.24. Asimismo, el valor p es muy pequeño. Por lo tanto, la 
hipótesis nula que todos los coeficientes de regresión son cero 
se puede rechazar. Al menos uno de los coeficientes de 
regresión múltiples es diferente a cero. 
b) 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

-118929 

19734 

-6 . 03 

0 . 000 

Loan 

1.6268 

0 . 1809 

8.99 

0 . 000 

Monthly 

Payment 

2 . 06 

14 . 95 

0 . 14 

0 . 892 

Payments 

Made 

50.3 

134 . 9 

0.37 

0 . 714 


La hipótesis nula es que el coeficiente es cero en la prueba 
individual. Se debería rechazar si t es menor que -2.120 o 
mayor que 2.120. En este caso, el valor t de la variable 
préstamo es mayor que el valor crítico. Por lo tanto, no se debe 
eliminar. Sin embargo, las variables pago mensual y pagos 
realizados es probable que se eliminen, 
c) La ecuación de regresión revisada es: Precio en la subasta = 
-119 893 + 1.67 Préstamo 


830 


33. La imagen de la captura de pantalla es la siguiente: 


35. a) La ecuación de regresión es 


Predictor 

Coef 

SE Coef 

T 

P 

Constant 

38 . 71 

39 . 02 

.99 

.324 

Bedrooms 

7 . 118 

2 . 551 

2.79 

0 . 006 

Size 

0 . 03800 

0 . 01468 

2.59 

0 . 011 

Pool 

18.321 

6.999 

2 . 62 

0.010 

Distance 

-0 . 9295 

0.7279 

-1.28 

0.205 

Garage 

35 . 810 

7.638 

4.69 

0 . 000 

Baths 

23 .315 

9.025 

2.58 

0.011 

S = 33.21 

R-Sq = 

53.2% R-Sq (adj ) = 

: 50. 3 : 

Analysis of 

Variance 



SOURCE 

DF 

SS MS 

F 

P 

Regression 

6 

122676 20446 

18 . 54 

0.000 

Residual Error 98 

108092 1103 



Total 

104 

230768 




a) Cada recámara adicional agrega $7 000 al precio de venta, cada 
pie cuadrado agrega $38, una alberca agrega ai valor $18 300, 
un garaje aumenta $35 800 el valor y cada milla que la casa 
está alejada del centro de la ciudad reduce $929 al precio de 
venta. 

b) El valor R al cuadrado es 0.532. 

c) La matriz de correlación es como sigue: 


Precio Recámaras Tamaño Alberca Distancia Garaje 


Recámaras 

0.467 





Tamaño 

0.371 

0.383 




Alberca 

0.294 

0.005 

0.201 



Distancia 

-0.347 

-0.153 

-0.117 

-0.139 


Garaje 

0.526 

0.234 

0.083 

0.114 

-0.359 

Baños 

0.382 

0.329 

0.024 

0.055 

-0.195 


Mantenimiento = 102 + 5.94 Edad + 0.374 Millas 
-11.8 indicador de gasolina. 

Cada año adicional de edad agrega $5.94 al costo de 
mantenimiento. 

Cada milla extra añade $0.374 al mantenimiento total. 

Los autobuses de gasolina son más baratos de mantener que 
los de diésel por $1 1 .80 por año. 

b) El coeficiente de determinación es 0.286, calculado por 
65 135/227 692. 29% de la variación del costo de 
mantenimiento se explica por estas variables. 

c) La matriz de correlación es: 



Mantenimiento 

Edad 

Millas 

Edad 

0.465 



Millas 

0.450 

0.522 


Indicador de gasolina 

-0.118 

-0.068 

0.025 


Edad y millas tienen correlaciones moderadamente fuertes con 
el costo de mantenimiento. La correlación más alta entre las 
variables Independientes es 0.522, entre edad y millas. Ésta es 
menos que 0.70, así que puede no ser un problema de 
multicolinealidad. 
d ) 

Analysis of Variance 


Source 

DF 

SS 

MS F P 

Regression 

3 

65135 

21712 10.15 0.000 

Residual Error 

76 

162558 

2139 

Total 

79 

227692 


El valor p es 

cero. 

Rechace la hipótesis nula de que todos los 


coeficientes son cero y afirme que al menos uno es importante. 


La variable independiente garaje tiene la correlación más fuerte 
con el precio. La distancia está inversamente relacionada, como 
se esperaba, y parece haber un problema con la correlación 
entre las variables independientes. 

d) Los resultados de la prueba global sugieren que algunas de las 
variables Independientes tienen coeficientes de regresión netos 
diferentes a cero. 

e) Podemos eliminar distancia. 

f) La Imagen de la captura de pantalla de la nueva regresión es la 
siguiente. 


Predictor 

Coef 

SE Coef T 

P 

Constant 

17 . 01 

35.24 .48 

. 630 

Bedrooms 

7 . 169 

2.559 2.80 

0 . 006 

Size 

0 . 03919 

0.01470 -2.67 

0 . 009 

Pool 

19 . 110 

6.994 2.73 

0 . 007 

Garage 

38 . 847 

7.281 5.34 

0 . 000 

Baths 

24 . 624 

8.995 2.74 

0 . 007 

S = 33.32 

R-Sq = 

52.4% R-Sq (adj ) = 

50.0% 

Analysis of 

Variance 


SOURCE 

DF 

SS MS F 

P 

Regression 

5 

120877 24175 21.78 

0 . 000 

Residual Error 99 

109890 1110 


Total 

104 

230768 



e) 


Predictor 

Coef 

SE Coef 


T 


P 

Constant 

102.3 

112 . 9 

0 . 

. 91 

0 . 

.368 

Age 

5.939 

2 .227 

2 . 

67 

0 . 

. 009 

Miles 

0 .3740 

0 . 1450 

2 . 

.58 

0 . 

. 012 

Gasolinelndicator 

-11.80 

10 . 99 

-1 . 

. 07 

0 . 

.286 


El valor p del indicador de gasolina es mayor a 0.10. Considere 
eliminarlo. 

f) La ecuación de regresión condensada es 

Mantenimiento = 106 + 6.17 Edad + 0.363 Millas. 

9) 

Histograma 

25 F 



Residuos 


Al revisar los valores p de los diversos coeficientes de regresión, La conjetura de normalidad parece ser realista. 

todos son menores que 0.05. Deje todas las variables 

Independientes. 

g) y h) El análisis de los residuos, que no se muestra, Indica que la 
suposición de normalidad es razonable. Además, no hay un 
patrón en las gráficas de los residuos y los valores ajustados 
de Y. 
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Residuos 


Residuos pronosticados 


h) 



Este diagrama parece ser aleatorio y tener una varianza 
constante. 


CAPÍTULO 15 

1. 114.6, calculado por ($19 989/$17 446)(100) 

123.1, calculado por ($21 468/$17 446)(100) 

124.3, calculado por ($21 685/$17 446)(100) 

91.3, calculado por ($15 922/$17 446)(100) 

105.3, calculado por ($18 375/$17 446)(100) 

314.2, calculado por ($54 81 8/$1 7 446)(100) 

3. 2003: 115.2, calculado por (581. 9/505.2)/(1 00) 

2004: 98.2, calculado por (496.1/505.2)/(100) 

2005: 90.4, calculado por (456.6/505.2)(100) 

2006: 85.8, calculado por (433.3/505.2)(100) 

3.35 4.49 

5. a) P, = (100) = 134.54 P s = (100) = 136.47 

2.49 3.29 

4.19 2.49 

Pe = j-^(IOO) = 263.52 P a = —(100) = 139.11 

14 52 

b) P = g16 (100) = 158.52 


c) 

d) 

e) 


$3.35(6) + 4.49(4) + 4.19(2) + 2.49(3) 
$2.49(6) + 3.29(4) + 1.59(2) + 1.79(3) (1 ° ’ 
$3.35(6) + 4.49(5) + 4.19(3) + 2.49(4) 
$2.49(6) + 3.29(5) + 1.59(3) + 1.79(4) 11 U ' 


147.1 

150.2 


/ = V(147.1)(150.2) = 148.64 


0.10 0.03 

7. a) P w = — (100) = 142.9 P c = — (1 00) = 75.0 

P S = ^(100) = 100 P H = ^|(100) = 125.0 

0.38 

b) p = — (100) = 111.8 

c) 

; _ 0.10(17 000) + 0.03(125 000) + 0.15(40 000) + 0.10(62 000) 

_ 0.07(17 000) + 0.04(125 000) + 0.15(40 000) + 0.08(62 000) 


(100) = 102.92 

d) 

0.10(20 000) + 0.03(130 000) + 0.15(42 000) + 0.10(65 000) 
“ 0.07(20 000) + 0.04(130 000) + 0.15(42 000) + 0.08(65 000) 

(100) = 103.32 

e) P = Vi 02.92(1 03.32) = 103.12 

$5.95(214) + 9.80(489) + 6.00(203) + 3.29(106) 

~ $1.52(200) + 2.10(565) + 1.48(291) + 3.05(87) ' 

= 349.06 


11. a) 


6.8 

5Í3 


( 0 . 20 ) 


362.26 

265.88 


(0.40) 


+ 


125.0 

109.6 


(0.25) 


622 864 
529 917 


(0.15) = 1.263. 

El índice es 126.3. 

b ) La actividad bursátil aumentó 26.3% de 2000 a 2005. 
13. X = ($89 673)/2.1324 = $42 053 


El salario “real” aumentó $42 053 - $19 800 = $22 253 


Año 

Tinora 

índice Tinora 

índice Nacional 

1995 

$28 650 

100.0 

100 

2004 

$33 972 

118.6 

122.5 

2009 

$37 382 

130.5 

136.9 


Los maestros de Tinora recibieron aumentos menores que el 
promedio nacional. 

17. El índice (2000 = 100) de años seleccionados es: 


Año 

2001 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

índice 

114.5 

129.7 

146.0 

160.4 

163.9 

172.0 

187.4 

186.6 

178.4 


Las ventas domésticas se fueron casi al doble entre 2000 y 2007 y 
después se endurecieron. 

19. El índice (2000 = 100) de años seleccionados es: 


Año 

2001 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

índice 

105.4 

116.8 

139.9 

165.1 

186.7 

198.6 

241.7 

265.2 

261.5 


Las ventas internacionales crecieron casi 1 60% entre 2000 y 2009. 
21. El índice (2000 = 100) de años seleccionados es: 


Año 

2001 

2002 

2003 

2004 

2005 

2006 

2007 

2008 

2009 

índice 

100.9 

107.3 

109.6 

108.9 

114.6 

121.1 

118.1 

117.6 

114.5 


El número de empleados aumentó casi 15% entre 2000 y 2009. 
23. El índice (2004 = 1 00) de años seleccionados es: 


Año 

2005 

2006 

2007 

2008 

2009 

índice 

113.4 

117.2 

125.4 

132.1 

136.6 


El ingreso aumentó casi 37% durante el periodo. 
25. El índice (2004 = 1 00) de años seleccionados es: 


Año 

2005 

2006 

2007 

2008 

2009 

índice 

94.5 

97.2 

98.2 

100.6 

99.4 


El número de empleados disminuyó casi 1 % entre 2004 y 2009. 
2.00 1.88 

27- P ma = WP7( 100) = 246.91 P sh = ——(100) = 223.81 
" 0.81 0.84 

2.89 3.99 

Pmi = J^-(IOO) = 200.69 P po = —(100) = 137.11 

29 n $2 ' 00(1 8) + 1 88(5) + 2 89(7Q) + 3 ' 99(27) m nm i -o 37 
$0.81(18) + 0.84(5) + 1.44(70) + 2.91 (27) 1 ' 

31. / = Vi 79.37(1 78.23) = 178.80 

0.60 0.90 

33. P H = TT^r(IOO) = 120 P s = ——(100) = 75.0 
0.50 1.20 

1.00 

Pw= 085 (100) = 11765 


832 


35. 

37. 

39. 


41. 

43. 

45. 


47. 

49. 

51. 


53. 


55. 


P = 


0.60(320) + 0.90(1 1 0) + 1 .00(230) 
0.50(320) + 1.20(110) + 0.85(230) 


(100) = 106.87 


P = V(106.87)(1 06.04) = 106.45 

0.05 0.12 

P c = ——(100) = 83.33 P c = 77^(100) = 120 
0.06 0.10 

0.18 .015 

Pp= 020 (100) = 9 ° Pe = 0T5 (100) = 100 
0.05(2 000) + 0.12(200) + 0.18(400) + 0.15(100) 

" 0.06(2 000) + 0.10(200) + 0.20(400) + 0.1 5(1 00) (1 ' 

= 89.79 


P = V(89.79)(91 .25) = 90.52 

0.76 2.50 

P A = ^r(1 00) = 264.8 P N = — (1 00) = 1 470.59 

26.00 490 

Pp = ^"( 10 °) = 81' 7-61 Pp = ^(100) = 368.42 

0.76(1 000) + 2.50(5 000) + 26(60 000) + 490(500) 

~ 0.287(1 000) + 0.17(5 000) + 3.18(60 000) + 133(500) 

(100) = 703.56 


P = V(703.56)(686.58) = 695.02 


/ = 100 


1 971.0 


1 159.0 

US*» 


(0.20) + |y(0.1 0) + 


123.05 


114.7 

110.6 


(0.40) 


La economía aumentó 23.05% de 1996 a 2009. 


Febrero: 

Marzo 

En 1995: 
En 2009: 


/ = 100 


6.8 23 303 

7777(0-40) + —(0.35) + 777777(0.25) 
8.0 20 300 


= 99.50 
■ 6.4 


/ = 100 


21 297 

„ (0.40) + —(0.35) + 777777(0.25) 
8.0 20 300 


= 93.5 

$1 876 466, calculado por $2 400 000/1 .279 
$2 028 986, calculado por $3 500 000/1 .725 


CAPÍTULO 16 

1. Los promedios móviles ponderados son: 31 584.3, 33 089.9, 
34 205.4, 34 899.8, 35 155.1 ,34 887.1 . 

3. La ecuación de regresión es Y = 8 842 - 88.1273Í 
En 2010, f = 12 y Y = 8 842 - 88.1273(12) = 7 784.47 
5. Y = 1 .30 + 0.90f 

Y = 1 .30 + 0.90 (7) = 7.6 


7. a) b = 


b) 

c) 


5.274318 - (1 .390087) (1 5)/5 


a = 


= 0.1104057 


= -0.0531997 


55 - (15) 2 /5 
1.104057 
10 

1.390087 15 

0.1104057 — 

5 \ 5 

28.95%, determinado po 1.28945 - 1.0 

Y = -0.0531997 + 0.1104057Í para 2010, t = 8 

Y = -0.0531997 + 0.1104057(8) = 0.8300459 
Antilogaritmo de 0.8300459 = 6.76 


9. Componente 

promedio 

del índice índice 

Trimestre estacional estacional 



1 

0.6859 

0 .6911 


2 

1 . 6557 

1 . 6682 


3 

1 . 1616 

1 . 1704 


4 

0.4732 

0.4768 


Pares estimados 

índice 

Predicción trimestral 

t 

(millones) 

estacional 

(millones) 

21 

40.05 

110.0 

44.055 

22 

41.80 

120.0 

50.160 

23 

43.55 

80.0 

34.840 

24 

45.30 

90.0 

40.770 


13. Y = 5.1658 + .37805 f. Los siguientes son estimaciones de ventas. 


Estimación 

índice 

Ajustado estacional 

10.080 

0.6911 

6.966 

10.458 

1.6682 

17.446 

10.837 

1.1704 

12.684 

11.215 

0.4768 

5.343 


15. a) Los residuos ordenados son: 2.61, 2.83, -48.50, 15.50, -3.72, 
17.17, 6.39,7.72, -0.41, -16.86, 3.81,7.25, 8.03, -1.08 y 
-0.75. 


Gráfica de serie de tiempo de RESI1 



b) Hay 2 variables independientes (k) y el tamaño de la muestra (n) 
es 15. Para un nivel de significancia de 0.05 el valor superior es 
1 .54. Como el valor calculado del estadístico de Durbin-Watson 
es 2.48, que está arriba del límite superior, no se rechaza la 
hipótesis nula. No hay autocorrelación entre estos residuos. 

17. a) Y = 18 000 - 400f, asumiendo que la recta inicia en 18 000 en 
1 990 y disminuye a 1 0 000 en 201 0. 

b) 400 

c) 8 000, calculado por 18 000 = 400(25) 

19. a) 

1.8 
1.6 
1.4 
1.2 
1.0 
0.8 
0.6 
0.4 
0.2 
0 

00 01 02 03 04 05 06 07 08 09 10 

b) Y = 1 .00455 + 0.04409f, utilizando t = 1 para 2000 

c) En 2003, Y = 1 . 1 8091 , y para 2004, Y = 1 .401 36 

d) En 2015, Y = 1.70999 

e) Cada activo cambió 0.044 veces. 

21. a) 50 

45 
40 
35 
30 
25 


b) Y = 49.140 - 2.98291 

c) En 2003, Y = 40.1913. Para 2005, Y = 34.2255. 


_J I I I I I 

01 02 03 04 05 06 
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d ) En 2009, / = 22.2939 

e) El número de empleados disminuyó a una tasa de 2 983 por 
año. 

23. a) Log Y = 0.790231 + .113669Í 

b) Log Y = 0.790231 , calculado por 0.790231 + 0.1 1 3669(0), el 
antllogaritmo es 6.169. 

Log Y = 1.813252, calculado por 0.790231 + 0.113669(9), el 
antllogaritmo es 65.051 . 

c) 29.92, que es el antllogaritmo de 0.1 1 3669 menos 1 . 

d) Log Y = 2.154258, antilogañtmo es 142.65. 

25. a) 

Precio de Oracle 


O 

"o 

03 

Q_ 


30 

25 

20 

15 

10 

5 

0 



1990 1995 2000 2005 2010 

Año 

b ) Las ecuaciones son Y = -1.35 + 1 .20 í y/o 

log Y = -0.221 + 0.0945Í. La ecuación utilizando el logaritmo 
parece mejor porque R 2 es mayor. 

c) log Y = -0.221 + 0.0945(4) = 0.157, el antilogañtmo es 
1.4355. 

log Y = -0.221 + 0.0945(9) = 0.6295, el antilogaritmo es 
1 .8767. 

d) log Y = -0.221 + 0.0945(23) = 1.9525, el antilogaritmo es 
7.0463. ¡Razonable si el precio se eleva a nivel histórico! 

e) La tasa anual de incremento es 9.91 %, calculado por el 
antilogaritmo de 0.0945 menos 1 . 

27. a) Julio 87.5; agosto 92.9; septiembre 99.3; octubre 109.1 


Mes 

Total 

Media 

Corregida 

Jul 

348.9 

87.225 

86.777 

Ago 

368.1 

92.025 

91.552 

Sep. 

395.0 

98.750 

98.242 

Oct. 

420.4 

105.100 

104.560 

Nov 

496.2 

124.050 

123.412 

Dic 

572.3 

143.075 

142.340 

Ene 

333.5 

83.375 

82.946 

Feb 

297.5 

74.375 

73.993 

Mar 

347.3 

86.825 

86.379 

Abr 

481.3 

120.325 

119.707 

May 

396.2 

99.050 

98.541 

Jun 

368.1 

92.025 

91 .552 



1 206.200 



Corrección = 1 200/1 206.2 = 0.99486 
c) Abril, noviembre y diciembre son periodos de ventas altas, en 
tanto que las ventas de febrero son las más bajas. 

Nota; La solución de los ejercicios 29 a 33 puede variar debido al 
redondeo y al paquete de software empleado. 

29. a) 


índice estacional por trimestre 

Componente 

índice 

Trimestre promedio del IE 

estacional 

1 0.5014 

0.5027 

2 1.0909 

1.0936 

3 1.7709 

1.7753 

4 0.6354 

0.6370 


b) La producción es mayor en el tercer trimestre, pues es 77.5% 
superior a la del trimestre promedio. El segundo trimestre 
también está arriba del promedio, el primero y el cuarto 
trimestres están muy abajo del promedio, con el primer 
trimestre en casi 50% de un trimestre típico. 

31. a) Los índices estacionales de un juego en paquete son los 

siguientes. Recuerde que el periodo 1 en realidad es julio, ya 
que los datos inician ese mes. 


Periodo 

índice 

Periodo 

índice 

1 

0.19792 

7 

0.26874 

2 

0.25663 

8 

0.63189 

3 

0.87840 

9 

1.67943 

4 

2.10481 

10 

2.73547 

5 

0.77747 

11 

1.67903 

6 

0.18388 

12 

0.60633 


Observe que el 4o. periodo (octubre) y el 1 0o. periodo (abril) son 
más del doble que el promedio. 
b) Los índices estacionales del juego sin paquete son: 


Periodo 

índice 

Periodo 

índice 

1 

1.73270 

7 

0.23673 

2 

1.53389 

8 

0.69732 

3 

0.94145 

9 

1.00695 

4 

1.29183 

10 

1.13226 

5 

0.66928 

11 

0.98282 

6 

0.52991 

12 

1.24486 


Estos índices son más constantes. Observe los valores muy 
bajos en los periodos 6o. (diciembre) y 7o. (enero), 
c) Los índices estacionales del juego total son: 


Periodo 

índice 

Periodo 

índice 

1 

0.63371 

7 

0.25908 

2 

0.61870 

8 

0.65069 

3 

0.89655 

9 

1.49028 

4 

1.86415 

10 

2.28041 

5 

0.74353 

11 

1.48235 

6 

0.29180 

12 

0.78876 


33. 


Estos índices muestran tanto los picos en octubre (4o. periodo) 
y abril (1 0o. periodo) como los valles en diciembre (6o. periodo) 
y enero (7o. periodo). 

d) El juego en paquete es relativamente más alto en abril. El juego 
que no está en paquete es relativamente alto en julio. Como 
70% del juego total proviene del juego en paquete, el juego 
total es muy similar al juego en paquete. 


índice estacional por trimestre 


Componente 

Trimestre promedio del IE 

índice 

estacional 

1 

1.1962 

1.2053 

2 

1.0135 

1.0212 

3 

0.6253 

0.6301 

4 

1.1371 

1.1457 


La ecuación de regresión es: Y = 43.61 1 + 7.21 1 53f 


Periodo 

Visitantes 

índice 

Predicción 

29 

252.86 

1.2053 

304.77 

30 

260.07 

1.0212 

265.58 

31 

267.29 

0.6301 

168.42 

32 

274.50 

1.1457 

314.50 


En 2010 hubo 928 visitantes. Un aumento de 10% en 2011 significa 
que habrá 1 021 visitantes. Las estimaciones trimestrales son 
1 021/4 = 255.25 visitantes por trimestre. 


834 


Periodo 

Visitantes 

índice 

Predicción 

Invierno 

255.25 

1.2053 

307.65 

Primavera 

255.25 

1.0212 

260.66 

Verano 

255.25 

0.6301 

160.83 

Otoño 

255.25 

1.1457 

292.44 


La aproximación de regresión es probablemente superior debido a 
que se considera la tendencia. 

35 . La ecuación de regresión de la Bolsa es Bolsa = 1 34 740 + 57 651 
x í. La ecuación de regresión del Precio es Precio = 20 21 1 + 

8 648 x f. Observe que tanto la pendiente como la intersección de 
la segunda ecuación son 15% de la parte correspondiente de la 
primera ecuación. El precio es siempre 15% de la bolsa. La bolsa 
proyectada para 201 1 es $1.52 millones, calculado por 134 740 + 
57 651 x (24). El precio ajustado es $227 755. 

37 . Las respuestas variarán. 

39 . Con 1988 como año base, la ecuación de regresión es: 

Y = 316 683 + 138 682f. El salario se incrementó a un rango de 
$138 682 por año durante el periodo. 


Salario 

Salario = 1 38 682 año - 3E+08 



1. a) 3 

b) 7.815 

3. a) Rechace H 0 si x 2 > 5.991 

„ 2 (10 - 20) 2 , (20 - 2 0) 2 , (30 - 20) 2 „„ „ 

1 * 20 20 20 

c) Rechace H 0 . Las proporciones no son iguales. 

5. H a \ Los resultados son ¡guales. H-, : Los resultados no son iguales. 
Rechace H 0 si x 2 > 9.236 


X 


2 


(3 ~ 5) 2 | | (7 — 5) 2 

5 5 


7.60 


No rechace H 0 . No puede rechazar la H 0 de que los resultados son 
iguales. 

H 0 \ No hay una diferencia entre las proporciones. 

/+, : Hay una diferencia entre las proporciones. 

Rechace H 0 si x 2 > 15.086. 

2 (47 - 40) 2 (34 - 40) 2 

X 40 + ' ' ' + 40 


= 3.400 


9 . 


11 . 


No rechace H 0 . No hay diferencia entre las proporciones. 

a) Rechace H 0 si x 2 > 9.210. 

„ . (30 - 24) 2 (20 - 24) 2 (10 - 12) 2 

b) x = 


24 


12 


2.50 


24 

c) No rechace H 0 . 

H q \ Las proporciones son como se indicaron; H 1 : Las proporciones 
no son como se indicaron. Rechace H 0 si x 2 > 11 -345. 


(50 - 25) 2 
25 


(1 60 - 275) 2 
275 


= 115.22 


Rechace H 0 . Las proporciones no son como se indicaron. 


13 . H 0 : La población de clientes sigue una distribución normal. 

H-¡: La población de clientes no sigue una distribución normal. 
Rechace la hipótesis nula si ji cuadrada es mayor a 5.991 . 


Número 
de clientes 

Valores z 

Área 

Calculada por 

fe 

Menos de 30 

Menos de -1.58 

0.0571 

0.5000 - 0.4429 

2.855 

30 a 40 

-1.58 a -0.51 

0.2479 

0.4429 - 0.1950 

12.395 

40 a 50 

-0.51 a 0.55 

0.4038 

0.1950 + 0.2088 

20.19 

50 ta 60 

0.55 a 1.62 

0.2386 

0.4474 - 0.2088 

11.93 

60 o más 

1 .62 o mayor 

0.0526 

0.5000 - 0.4474 

2.63 


La primera y la última clase tienen frecuencias esperadas menores 
a 5. Están combinadas con las clases adyacentes. 


Número 
de clientes 

Área 

fe 

fe 

fe ~fe 

(fe~ fef 

Wo - fe) 2 ]/ fe 

Menos de 40 

0.3050 

15.25 

16 

-0.75 

0.5625 

0.0369 

40 hasta 50 

0.4038 

20.19 

22 

-1.81 

3.2761 

0.1623 

50 o más 

0.2912 

14.56 

12 

2.56 

6.5536 

0.4501 

Total 

1.0000 

50.00 

50 

0 


0.6493 


15 . 

17 . 


Como 0.6493 no es mayor a 5.991, no se rechaza la hipótesis nula. 
Estos datos podrían provenir de una distribución normal. 

El valor p de 0.746 es mayor a 0.05 y los valores trazados están 
próximos a la recta. Por lo tanto, es razonable afirmar que las 
lecturas siguen una distribución normal. 

H 0 -, No hay relación entre los tamaños de la comunidad y la sección 
leída. H+ Hay una relación. Rechace H 0 si x 2 > 9.488. 


2 _ (170 - 157.50) 2 (88 - 83.62) 2 

: ~ 157.50 + ' ' ' + 83 62 


7.340 


19 . 


No rechace H 0 . No hay relación entre el tamaño de la comunidad y 
la sección leída. 

H 0 : No hay relación entre las tasas de error y el tipo de artículo. 

/+, : Hay una relación entre las tasas de error y el tipo de artículo. 
Rechace H 0 si x 2 > 9.21 . 


, (20 - 14.1 f (225 - 225. 25) 2 

* 14.1 225.25 


No rechace H 0 . No hay relación entre las tasas de error y el tipo de 
artículo. 

21 . H 0 : ir s = 0.50, ir r = ir e = 0.25 

Hi : La distribución no es como se dio antes. 
gl = 2. Rechace H 0 si x 2 > 4.605. 


Vuelta 

fe 

fe 

fe~ fe 

(fe ~ ff/fe 

Derecho 

112 

100 

12 

1.44 

Derecha 

48 

50 

-2 

0.08 

Izquierda 

40 

50 

-10 

2.00 

Total 

200 

200 


3.52 


No se rechaza H 0 . Las proporciones son como se dieron en la 
hipótesis nula. 

23. H 0 : No hay preferencia con respecto a las estaciones de TV. 

H 1 : Hay preferencia con respecto a las estaciones de TV. 
gl = 3-1 = 2. Se rechaza H 0 si x 2 > 5.991 . 


Estación TV 

fe 

fe 

fe ~fe 

(fe ~ fef (fe ~ « 7 f. 

WNAE 

53 

50 

3 

9 0.18 

WRRN 

64 

50 

14 

196 3.92 

WSPD 

33 

50 

-17 

289 5.78 


150 

150 

0 

9.88 


Se rechaza H 0 . Hay una preferencia por las estaciones de TV. 


835 


31 . 


Trazo de probabilidad de inscripción 
Normal 


25 . H 0 : TT n = 0.21 , ir m = 0.24, tt s = 0.35, -n w = 0.20 
H-¡: La distribución no es como se dio. 

Rechace H 0 si x 2 > 11 -345. 


Región 

fo 

fe 

lo- fe 

(fe- fe?/ fe 

Noreste 

68 

84 

-16 

3.0476 

Oeste medio 

104 

96 

8 

0.6667 

Sur 

155 

140 

15 

1.6071 

Oeste 

73 

80 

-7 

0.6125 

Total 

400 

400 

0 

5.9339 


No se rechaza H 0 . La distribución del orden de los destinos refleja 
la población. 

27 . H 0 : Las proporciones son las mismas. 

H,: Las proporciones no son las mismas. 

Rechace H 0 si x 2 > 16.919. 


fe 

fe 

fe~ fe 

(fe -fef 

(fe- fe) 2 / fe 

44 

28 

16 

256 

9.143 

32 

28 

4 

16 

0.571 

23 

28 

-5 

25 

0.893 

27 

28 

-i 

1 

0.036 

23 

28 

-5 

25 

0.893 

24 

28 

-4 

16 

0.571 

31 

28 

3 

9 

0.321 

27 

28 

-1 

1 

0.036 

28 

28 

0 

0 

0.000 

21 

28 

-7 

49 

1.750 





14.214 


No rechace H 0 . Los dígitos siguen una distribución uniforme. 

29 . 


Salario por hora 

/ 

M 

m 

M- X 

(M - x) 2 

f(M - x) 2 

$5.50 hasta 6.50 

20 

6 

120 

-2.222 

4.938 

98.8 

6.50 hasta 7.50 

24 

7 

168 

-1.222 

1.494 

35.9 

7.50 hasta 8.50 

130 

8 

1 040 

-0.222 

0.049 

6.4 

8.50 hasta 9.50 

68 

9 

612 

0.778 

0.605 

41.1 

9.50 hasta 10.50 

28 

10 

280 

1.778 

3.161 

88.5 

Total 

270 


2 220 



270.7 


La media muestral es 8.222, calculada por 2 220/270. La desvia- 
ción estándar de la muestra es 1 .003, calculada como la raíz 
cuadrada de 270.7/269. 

H 0 : La población de salarios sigue una distribución normal. 

H,: La población de salarios no sigue una distribución normal. 
Rechace la nula si j¡ cuadrada es mayor a 7.779. 


Salario 

Valores z 

Área 

Calculada 

por 

f e 

f 0 

fe~ fo 

K.-0 2 


Menor a 
$6.50 

Menor a 
-1.72 

0.0427 

0.5000 - 
0.4573 

11.529 

20 

-8.471 

71.7578 

6.2241 

6.50 a 

7.50 

-1.72 a 
-0.72 

0.1931 

0.4573 - 
0.2642 

52.137 

24 

28.137 

791.6908 

15.1848 

7.50 a 

8.50 

-0.72 a 

0.28 

0.3745 

0.2642 + 
0.1103 

101.115 

130 

-28.885 

834.3432 

8.2514 

8.50 a 

9.50 

0.28 a 

1.27 

0.2877 

0.3980 - 

0.1103 

77.679 

68 

9.679 

93.6830 

1.2060 

9.50 
o más 

1.27 
o más 

0.1020 

0.5000 - 
0.3980 

27.54 

28 

-0.46 

0.2116 

0.0077 

Total 


1.0000 


270 

270 

0 


30.874 


Como 30.874 es mayor a 7.779, se rechaza la hipótesis nula, es 
decir, no hay una distribución normal. 



Media 

22163 

Desv. est. 

14 734 

N 

13 

AD 

0.594 

Valor p 

0.097 


El valor p (0.097) es mayor a 0.05. No rechace la hipótesis nula. Los 
datos podrían seguir una distribución normal. 

33. H 0 \ El género y la actitud hacia el déficit no están relacionados. 

H, : El género y la actitud hacia el déficit están relacionados. 
Rechace H 0 si x 2 > 5.991 . 


X 


2 


(244 - 292.41) 2 (194 - 164.05) 2 

292.41 + 164.05 

(68 - 49. 53) 2 (305 - 256.59) 2 

+ 49.53 + 256.59 

(114 — 143.95) 2 (25 - 43.47) 2 

+ 143.95 + 43.47 


43.578 


35 . 


Como 43.578 > 5.991 , rechace H 0 . La posición de una persona 
respecto al déficit está influenciada por su género. 

H 0 : Si se hace un reclamo y la edad no están relacionados. 

H,: Si se hace un reclamo y la edad están relacionados. 
Rechace H 0 si x 2 > 7.815. 


2 _ (170 - 203.33) 2 (24 - 35.67) 2 

! ~ 203.33 + ' ' ' + 35 67 


53.639 


Rechace H 0 . La edad está relacionada a si se hace un reclamo. 
37 . Hq- TTq/_ ~ Ho ~ .23, TTy ~ TTq — .16, IT bb = TTfí .12. 

Las proporciones no son como se dieron. Rechace H 0 si 
X 2 > 15.086. 


Color 

fe 

fe 

(fe ~ fe) 2 / fe 

Azul 

12 

16.56 

1.256 

Café 

14 

8.64 

3.325 

Amarillo 

13 

10.80 

0.448 

Rojo 

14 

8.64 

3.325 

Naranja 

7 

16.56 

5.519 

Verde 

12 

10.80 

0.133 

Total 

72 


14.006 


No rechace H 0 . La distribución del color concuerda con la 
información del fabricante. 

39. a) H 0 : El salario y las victorias no están relacionados. 

H 1 : El salario y las victorias están relacionados. 
Rechace H 0 si x 2 > 3.84. 


Victoria 

Salario 

Mitad baja Mitad alta 

Total 

No 

9 

5 

14 

Si 

6 

10 

16 

Total 

15 

15 



, (9-7 ) 2 , (5 — 7) 2 , (6 — 8) 2 , (10 - 8) 2 _ 

* 7 7 8 8 

No rechace H 0 . Concluya que el salario y las victorias pueden 

no estar relacionados. 


836 


Porcentaje Porcentaje 


Trazo de probabilidad para asistencia 
normal 


11 . 


b) 



Asistencia 


Trazo de probabilidad para salario 



Media 

88.51 

Desv. est. 

33.90 

N 

30 

AD 

0.774 

Valor p 

0.039 


0 50 100 150 200 

Salario 

El valor p del salario es 0.039, que es menor a 0.05. 

Rechace la hipótesis nula. Los salarios no siguen una 
distribución normal. Sin embargo, el valor p de asistencia es 
0.108, que es mayor a 0.05. No rechace la hipótesis nula. La 
asistencia podría no seguir una distribución normal. 


CAPÍTULO 18 

1. a) Si el número de pulsos (éxitos) en la muestra es 9 o mayor, 
rechace H 0 . 

b ) Rechace H 0 debido a que la probabilidad acumulada asociada 
con nueve o más éxitos (0.073) no sobrepasa el nivel de 
significancia (0.10) 

3. a) H 0 : n ^ .50; Hp tt > .50; n — 10 


5. 


7. 


b) 

c) 

a) 

b) 

c) 

d) 


Se rechaza H 0 si hay nueve o más signos de más. Un “+” 
representa una pérdida. 

Rechace H 0 . Es un programa eficaz, ya que hubo 9 personas 
que bajaron de peso. 

H 0 : ir < .50 (No hay cambio de peso). 

Hp ir > .50 (Hay una pérdida de peso). 

Rechace H 0 si z > 1 .65 

(32 - .50) - .50(45) 

z = ' ' = 2.68 

.50V45 

Rechace H 0 . El programa de pérdida de peso es eficaz. 


H 0 : ir < .50, H,: ir > .50. Se rechaza H 0 si z > 2.05. 


z = 


42.5 - 40.5 
4.5 


= .44 


9. a) 
b) 


c) 


Como 0.44 < 2.05, no rechace H 0 . No hay preferencia. 
H 0 : Mediana < $81 ,500; H ^ : Mediana > $81 500 
Se rechaza H 0 si z > 1 .65 


z = 


170 - .50 - 100 
7L07 


9.83 


Se rechaza H 0 . El ingreso mediano es mayor que $81 500. 


Pareja 

Diferencia 

Rango 

1 

550 

7 

2 

190 

5 

3 

250 

6 

4 

-120 

3 

5 

-70 

1 

6 

130 

4 

7 

90 

2 


Sumas: -4, +24. Por lo tanto, T = 4 (la menor de las dos 
sumas). Del apéndice B.7, nivel de significancia de 0.05, n = 7, 
el valor crítico es 3. Como T de 4 > 3, no rechace H 0 (prueba de 
una cola). No hay diferencia entre los pies cuadrados. Las 
parejas de profesionales no viven en casas más grandes. 

13. a) H 0 . La producción de los dos sistemas es la misma. 

H-¡: La producción utilizando el método de Mump es mayor. 

b) Se rechaza H 0 si T < 21 , n = 1 3. 

c) Los cálculos de los primeros tres empleados son: 


Empleado 

Edad 

Mump 

d 

Rango 

R + R~ 

A 

60 

64 

4 

6 

6 

B 

40 

52 

12 

12.5 

12.5 

C 

59 

58 

-1 

2 

2 


La suma de los rangos negativos es 6.5. Como 6.5 es menor 
que 21 , se rechaza H 0 . La producción empleando el método de 
Mump es mayor. 

15. H 0 \ Las distribuciones son iguales. H+ Las distribuciones no son 
iguales. Rechace H 0 si z < - 1 .96 o bien z > 1 .96. 


A 



B 

Calificación 

Rango 

Calificación Rango 

38 

4 

26 

1 

45 

6 

31 

2 

56 

9 

35 

3 

57 

10.5 

42 

5 

61 

12 

51 

7 

69 

14 

52 

8 

70 

15 

57 

10.5 

79 

16 

62 

13 


86.5 


49.5 


17. 


86.5 - 


8(8 + 8 + 1 ) 


1.943 


No se rechaza H 0 . No hay diferencia en las dos poblaciones. 

H 0 : Las distribuciones son iguales. H+ La distribución del campus 
es a la derecha. Rechace H 0 si z > 1 .65. 


Campus 

En línea 

Edad 

Rango 

Edad 

Rango 

26 

6 

28 

8 

42 

16.5 

16 

1 

65 

22 

42 

16.5 

38 

13 

29 

9.5 

29 

9.5 

31 

11 

32 

12 

22 

3 

59 

21 

50 

20 

42 

16.5 

42 

16.5 

27 

7 

23 

4 

41 

14 

25 

5 

46 

18 

19 

2 

158.5 


94.5 


837 


12(12 + 10 + 1 ) 

2 

/ 1 2(1 0)(1 2 + 10 + 1) 

V 12 


1.35 


19. 


21 . 


No se rechaza H 0 . No hay diferencia en las distribuciones. 

ANOVA requiere que tenga dos o más poblaciones. Los datos están 
a nivel de intervalo o de razón, las poblaciones están normalmente 
distribuidas, y las desviaciones estándar de las poblaciones son 
iguales. Kruskal-Wallis sólo requiere datos a nivel ordinal, y no se 
hacen suposiciones respecto a la forma de las poblaciones. 

a) H 0 . Las tres distribuciones de la población son ¡guales. Hp No 
todas las distribuciones son iguales. 

b) Rechace H 0 si H > 5.991 


Rango Rango 

Rango 

8 

5 

1 

11 

6.5 

2 

14.5 

6.5 

3 

14.5 

10 

4 

16 

12 

9 

64 

13 

19 


53 


H = 

12 

(64)2 + 

16(16 + 1) 

5 

= 

59.98 - 51 

= 8.98 


(53f 

6 


+ 


( 19 f 
5 


- 3(16 + 1) 


d ) Rechace H 0 debido a que 8.98 > 5.991 . Las tres distribuciones 
no son iguales. 

23. H 0 : Las distribuciones de las duraciones de vida son iguales. 

Hp Las distribuciones de las duraciones de vida no son iguales. 
Se rechaza H 0 si H > 9.210. 


Sal 

Dulce 

Otros 

Horas 

Rango 

Horas 

Rango 

Horas 

Rango 

167.3 

3 

160.6 

1 

182.7 

13 

189.6 

15 

177.6 

11 

165.4 

2 

177.2 

10 

185.3 

14 

172.9 

7 

169.4 

6 

168.6 

4 

169.2 

5 

180.3 

12 

176.6 

9 

174.7 

8 


46 


39 


35 


H = 


- 3(16) = 0.62 


12 i (46) 2 | (39) 2 | (35) 2 
1 5(1 6) L 5 5 5 

No se rechaza H 0 . No hay diferencia entre las tres distribuciones. 

25. a) 

Diagrama de dispersión de mujeres versus hombres 


14 
12 
10 
fe 8 

i 6 

4 
2 
0 

0 2 4 6 8 10 12 14 

Hombre 



b) 


c) 


Hombre 

Mujer 

d 

d 2 

4 

5 

-i 

1 

6 

4 

2 

4 

7 

8 

-1 

1 

2 

7 

-5 

25 

12 

ii 

i 

1 

8 

6 

2 

4 

5 

3 

2 

4 

3 

9 

-6 

36 

13 

2 

11 

121 

14 

10 

4 

16 

1 

1 

0 

0 

9 

13 

-4 

16 

10 

12 

-2 

4 

11 

14 

-3 

9 



Total 

242 


6(242) 

1 4 ( 1 4 2 - 1 ) 


= 0.47 


H 0 : No hay correlación entre los rangos. 

H 1 : Hay una correlación positiva entre los rangos. 


Rechace H 0 si f > 1 .782. 

-WSSr 1 - 84 

Se rechaza H 0 . Concluya que la correlación de rangos entre la 
población es positiva. A los maridos y a las esposas en general 
les gustan los mismos programas. 


Representante Ventas Rango 

Rango de 

entrenamiento d 

d 2 

1 

319 

3 

3 

0 

0 

2 

150 

10 

9 

1 

1 

3 

175 

9 

6 

3 

9 

4 

460 

1 

1 

0 

0 

5 

348 

2 

4 

-2 

4 

6 

300 

4.5 

10 

-5.5 

30.25 

7 

280 

6 

5 

1 

1 

8 

200 

7 

2 

5 

25 

9 

190 

8 

7 

i 

1 

10 

300 

4.5 

8 

-3.5 

12.25 






83.50 


6(83.5) 
10 ( 1 0 2 - 1 ) 


0.494 


Una correlación positiva moderada. 
b ) H 0 : No hay correlación entre los rangos. Hp Hay correlación 
positiva entre los rangos. Rechace H 0 si f > 1 .860. 


f = 0.494. / 1 ° - = 1.607 

V 1 - (0.494) 2 

No se rechaza H 0 . La correlación de los rangos entre la 
población podría ser 0. 

29. H 0 : ir = .50; Hp ir + .50; Utilice un paquete de software para 
desarrollar la distribución de probabilidad normal para n = 19 y 
ir = 0.50. Se rechaza H 0 si hay 5 o menos signos “+” o bien 14 o 
más. El total de 12 signos “+” cae en la región de aceptación. No 
se rechaza H 0 . No hay preferencia entre los dos programas. 

31. H 0 : ir = .50 Hp ir A .50 

Se rechaza H 0 si hay 1 2 o más o 3 o menos signos de menos. 
Como sólo hay 8 signos de más, no se rechaza H 0 . No hay 
preferencia con respecto a las dos marcas de componentes. 

33. H 0 : 7t = .50; Hp i \ + .50. Rechace H 0 si z > 1 .96 o bien z < -1.96. 


159.5 - 100 
7.071 


8.415 


Rechace H 0 . Hay una diferencia entre las preferencias por los dos 
tipos de jugo de naranja. 


838 


35. 


37. 


39. r. 


1 - - 


= 0.727 


H 0 : Las tasas son ¡guales; H+ Las tasas no son ¡guales. 

Se rechaza H 0 si H > 5.991 . H = 0.082. No rechace H 0 . 

H 0 : Las poblaciones son las mismas. H-, \ Las poblaciones difieren. 
Rechace H 0 si H > 7.815. H = 14.30. Rechace H 0 . 

6(78) 

1 2 ( 1 2 2 - 1 ) 

H 0 : No hay correlación entre los rangos de los entrenadores y de 
los cronistas deportivos. 

H-, : Hay una correlación positiva entre los rangos de los 
entrenadores y de los cronistas deportivos. 

Rechace H 0 si f > 1 .81 2. 


t = 0.727. 


12-2 
1 - (,727) 2 


: 3.348 


Se rechaza H 0 . Hay una correlación positiva entre los escritores 
deportivos y los entrenadores. 

41. a) H 0 : No hay diferencia entre las distribuciones de los precios de 
venta en los cinco municipios. Hp Hay una diferencia entre las 
distribuciones de los precios de venta de los cinco municipios. 
Se rechaza H 0 si H es mayor que 9.488. El valor calculado de H 
es 4.70, por lo que se rechaza la hipótesis nula. Los datos de la 
muestra no sugieren una diferencia entre las distribuciones de 
los precios de venta. 

b) H 0 : No hay diferencia entre las distribuciones de los precios de 
venta dependiendo del número de recámaras. Hp Hay una 
diferencia entre las distribuciones de los precios de venta 
dependiendo del número de recámaras. Se rechaza H 0 si H es 
mayor que 9.448. El valor calculado de H es 16.34, por lo que 
se rechaza la hipótesis nula. Los datos de la muestra indican 
que hay una diferencia entre las distribuciones de los precios de 
venta con base en el número de recámaras. Nota: Combine 6 o 
más en un solo grupo. 

c) H 0 : No hay diferencia entre las distribuciones de las distancias 
desde el centro de la ciudad dependiendo de si la casa tiene 
alberca o no. Hp Hay una diferencia entre las distribuciones de 
las distancias desde el centro de la ciudad dependiendo de si la 
casa tiene una alberca o no. Se rechaza H 0 si H es mayor que 
3.84. El valor calculado de H es 3.37, por lo que no se rechaza 
la hipótesis nula. Los datos de la muestra no sugieren una 
diferencia entre las distribuciones de las distancias. 

43. a) H 0 : Las distribuciones de los costos de mantenimiento de todos 
los fabricantes son las mismas. 

Hp Las distribuciones de los costos no son ¡guales. 

Rechace H 0 si H > 5.991 . 


H 


12 


(1 765) 2 (972) 2 (503) 2 


3(81) = 8.29 


b ) 


80(81) L 47 25 8 

Se rechaza H 0 . Hay diferencia entre el costo de mantenimiento 
de los tres fabricantes de autobuses. 

H 0 : Las distribuciones de los costos de mantenimiento son 
¡guales para las capacidades de los autobuses. 

Hp Las distribuciones de los costos no son ¡guales. 

Rechace H n si H > 7.815. 


H = 


12 

80(81) 


(96. 5) 2 
4 


(332. 5) 2 


(388. 5) 2 
9 


(2 422. 5) 2 
60 


- 3(81) = 2.74 

No se rechaza H 0 . No hay diferencia entre los costos de 
mantenimiento de las cuatro distintas capacidades. 

H 0 : Las distribuciones son iguales. 

H, : Las distribuciones son diferentes. 


Rechace H 0 si z < ■ 


1.96 oz> 1.96. 

53(53 + 27 + 1) 


2 252 


W = 


(53) (27) (53 + 27 + 1) 
12 


' = 1.07 


No rechace H 0 . Las distribuciones podrían ser iguales. 


CAPITULO 19 

1 . 


3. 


5. 


7. 



Problema Poco amigable 
no corregido 

Precio alto 


Error en 
la factura 
Espera larga 


Conteo 

38 

23 

12 

10 

8 

Porcentaje 

42 

25 

13 

11 

9 

Porc. 

42 

67 

80 

91 

100 

acumulado 







Casi 67% de las quejas se refieren al problema que no está siendo 
corregido y a que el precio es demasiado alto. 

La variación casual es de naturaleza aleatoria; como la causa es 
una variedad de factores, no se puede eliminar por completo. La 
variación asignable no es aleatoria; en general, se debe a una 
causa específica y se puede eliminar, 

a) El factor A 2 es 0.729. 

El valor de D 3 es 0, y para D 4 es 2.282. 

LCS m 46.78 


41.92 


b) 

a) 



37.06 


8:30 9 

9:30 10 

10:30 


X, 



Medias 

/?, 

Hora 

aritméticas Rango 

8:00 a.m. 

46 

16 

8:30 a.m. 

40.5 

6 

9:00 a.m. 

44 

6 

9:30 a.m. 

40 

2 

10:00 a.m. 

41.5 

9 

10:30 a.m. 

39.5 

1 


251.5 

40 


- 251.5 - 40 

X = — — = 41 .92 R = — = 6.67 
6 6 

LCS = 41.92 + 0.729(6.67) = 46.78 
LCI = 41.92 - 0.729(6.67) = 37.06 

b) Interpretando, la lectura media fue 341 .92 grados Fahrenheit. Si 
el horno continúa operando según la evidencia de las primeras 
seis lecturas por hora, casi 99.7% de las lecturas medias se 
encontrarán entre 337.06 grados y 346.78 grados. 

9. a) La fracción defectuosa es 0.0507. El límite de control superior 
es 0.0801 y el límite de control inferior es 0.0213. 

c) Sí, las muestras 7a. y 9a. indican que el proceso está fuera de 
control. 

c) El proceso parece permanecer Igual. 

37 

11. 5 = — = 2.64 
14 

2.64 ± 3 V2M 

Los límites de control son 0 y 7.5. El proceso está fuera de control 

en el séptimo día. 


839 


13. c = 


17. 


19. 


_6 

11 


= 0.545 


b) 


0.545 ± 3 V01545 = 0.545 ± 2.215 

Los límites de control son de 0 a 2.760, por lo que no hay recibos 
fuera de control. 


15. 


Porcentaje Probabilidad de 
defectuoso aceptar el lote 




P(X< 1 \n = 10, ir = .10) = .736 

P(X< 1 \n = 10, ir = .20) = .375 

P(Xfi 1 \n = 10, ir = .30) = .149 

P(X£ 1 \n = 10, ir = .40) = .046 



200 - 
150 - 
100 - 
50- 
0 



-100 
- 80 
-60 ; 
-40 j 
-20 
0 


21. a) LCS = 10.0 + 0.577(0.25) = 10.0 + 0.14425 
= 10.14425 

LCI = 10.0 - 0.577(0.25) = 10.0 - 0.14425 
= 9.85575 

LCS = 2.115(0.25) = 0.52875 
LCI = 0(0.25) = 0 

b) La media es 10.16, que está arriba del límite de control superior 
y fuera de control. Hay demasiada cola en las bebidas 
gaseosas. La variación del proceso está bajo control; es 
necesario un ajuste. 

61 1 .3333 


Razón 

Alambrado 

Bobina con 

Bujía 

Otra 

Conteo 

pobre 

corto circuito defectuosa 

10 

Porcentaje 

80 

60 

50 

5.0 

% acumulado 

40.0 

30.0 

25.0 

100.0 


40.0 

70.0 

95.0 



23. a) X 


= 30.57 


= 15.6 


20 
312 
20 

LCS = 30.5665 + (1.023)(15.6) ¡ 
30.5665 - (1 ,023)(15.6) ; 
2.575(15.6) = 40.17 



LCS =46.53 

X = 30.57 
LCI= 14.61 

LCS =40.16 

R= 15.60 
LCI =0.000 


25. X 


c) Todos los puntos parecen estar dentro de los límites de control. 
No es necesario hacer ajustes. 

4 183 


10 


418.3 


- 162 
P = — = 16 .2 

LCS = 418.3 + (0.577)(1 6.2) = 427.65 
LCI = 418.3 - (0.577)(1 6.2) = 408.95 
LCS = 2.115(16.2) = 34.26 

Todos los puntos están en control, tanto en el caso de la media 
como del rango. 

27 ' *» ” " " 008 

o.™ 

LCS = 0.08 + 0.115 = 0.195 
LCI = 0.08 - 0.115 = 0 

0.2 


b) 



29. 


123456789 10 
Muestras 

c) No hay puntos que sobrepasen los límites. 

Gráfica P de C1 


R = 


LCI 

LCS 


46.53 

14.61 



LCS = 0.4337 


P= 0.25 


LCI =0.06629 
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31. 


Estos resultados muéstrales indican que las posibilidades de 
aumento son mucho menores que 50-50. El porcentaje de acciones 
que aumentan está “en control” alrededor de 0.25 o 25%. Los 


límites de control son 0.06629 y 0.4337. 
P(X£ 3|n = 10, ir = 0.05) = 0.999 
P(X £ 3¡n = 10, ir = 0.10) = 0.987 

P(X £ 3¡n = 10, ir = 0.20) = 0.878 

P(X £ 3|n = 10, ir = 0.30) = 0.649 

P(X £ 5|n = 20, ir = 0.05) = 0.999 

P(X £ 5|n = 20, ir = 0.10) = 0.989 

P(X £ 5|n = 20, ir = 0.20) = 0.805 

P(X£ 5|n = 20, ir = 0.30) = 0.417 



La línea continua es la curva característica de operación del primer 
plan y la línea discontinua del segundo. El proveedor debería 
preferir el primero debido a que la probabilidad de aceptación es 
más alta (arriba). Sin embargo, si está completamente seguro de su 
calidad, el segundo plan parece más alto en el rango muy bajo de 
porcentajes defectuosos y se podría preferir. 

21 3 

33. a) c = ——= 14.2; 3VT4Í2 = 11.30 
1 5 

LCS = 14.2 + 11.3 = 25.5 
LCI = 14.2 - 11.3 = 2.9 



35. c 


70 

10 


= 7.0 


LCS = 7.0 + 3V7 = 14.9 
LCI = 7.0 - 3V7 = 0 

16 



1 2 3 4 5 6 7 8 9 10 
Día 


37. P(X £ 3|n = 20, ir = .10) = .867 

P(X £ 3|n = 20, ir = .20) = .412 

P(X £ 3 ¡ r? = 20, ir = .30) = .108 

1.0 


1 ■§ 0.6 
1 | 0.4 


0.0 

0 5 10 15 20 25 30 35 40 

Porcentaje defectuoso del lote de entrada 



c) Todos los puntos están en control. 
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Apéndice C 

Respuestas a los ejercicios de repaso impares 


REPASO DE LOS CAPÍTULOS 1-4 
PROBLEMAS 

1. a) La media es 147.9. La mediana es 148.5. La desviación 
estándar es 69.24. 

b) El primer cuartil es 1 06. El tercer cuartil es 1 86.25. 








1 1 1 1 1 1 1 

0 50 100 150 200 250 300 


No hay datos atípicos. La distribución es simétrica. Los bigotes 
y las cajas son más o menos ¡guales en ambos lados. 

2gg — 14 

d) 2 6 = 64, use 6 clases; i = = 47.5, use i = 6. 


Cantidad 

Frecuencia 

$ 0a$ 50 

3 

50 a 100 

8 

100 a 150 

15 

150 a 200 

13 

200 a 250 

7 

250 a 300 

7 

Total 

50 


e) Las respuestas vaharán, pero Incluya toda la información 
anterior. 

3. a) La media es $35 768. La mediana es $34 405. La desviación 
estándar es $5 992. 

b) El primer cuartil es $32 030. El tercer cuartil es $38 994. 

c) 








1 1 1 1 1 1 1 

30 000 35 000 40 000 45 000 50 000 55 000 60 000 


5. a) Diagrama de caja. 

b) La mediana es 48, el primer cuartil es 24, y el tercero es 84. 

c) Con sesgo positivo, con la cola larga a la derecha. 

d) No es posible determinar el número de observaciones. 


REPASO DE LOS CAPÍTULOS 5-7 


PROBLEMAS 

1. 

a) 

.035 


b) 

.018 


c) 

.648 

3. 

a) 

.0401 


b) 

.6147 


c) 

7 440 

5. 

a) 

|JL = 1 .10 
(X = 1.18 


b) 

Cerca de 550 


c) 

|jl = 1 .833 


REPASO DE LOS CAPÍTULOS 8 Y 9 
PROBLEMAS 


1. Z = 8 8 , ^ = 0.59, .5000 - .2224 = .2776 
2.0/V35 

3. 160 ± 2.426 —7=, 152.33 a 167.67 
V40 

5. 985.5 ± 2.571 - — 864.27 a 1 106.73 

Ve 

7. 240 ± 2.131 — ?=, 221 .35 a 258.65 
VÍ6 


Porque 250 está en el intervalo, la evidencia no indica un aumento 
de la producción. 


9. 

11 . 

13. 


n = 


1.96(25)1 2 
4 


150 


n = ,08(.92)| 


2.33 

0.02 


n = ,4(.6) 


2.33 

0.03 


= 999 
1 448 


Hay dos datos atípicos por encima de $50 000. La distribución 
tiene un sesgo positivo. Los bigotes y las cajas de la derecha son 
mucho más grandes que los de la izquierda. 


Cantidad 

Frecuencia 

$24 000 a 30 000 

8 

30 000 a 36 000 

22 

36 000 a 42 000 

15 

42 000 a 48 000 

4 

48 000 a 54 000 

1 

54 000 a 60 000 

1 

Total 

51 


e) Las respuestas variarán, pero Incluya toda la información 
anterior. 


REPASO DE LOS CAPÍTULOS 10-12 
PROBLEMAS 

1 . H 0 : n, > 36; /+,: (i < 36. Rechace H 0 si t < — 1 .683. 


35.5 - 36.0 
0.9/V42 


-3.60 


Rechace H 0 . La altura media es menor a 36 pulgadas. 
3. H 0 : (jl < 20, /+,: |x > 20. Rechace H 0 si f > 1 .860. 


21 - 20 
6.185/V9 


0.485 


H 0 no se rechaza. La cantidad media de tiempo improductivo no es 
mayor a 20 minutos. 

5. H 0 : <0 > 0. Rechace H 0 si f > 1 .883. 

5 = 0.4 a, = 6.11 f = 6^v^ = °-21 
H 0 no se rechaza. No existe diferencia en la vida de las pinturas. 
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7. Por estatus social 

H 0 : La media del estatus social autodefinido por los empleados no 
es la misma. 

H,: La media del estatus social autodefinido por los empleados no 
es la misma. 

Rechace H 0 si F > 4.26. 

Para el antecedente educativo. 

H 0 : La media de calificaciones del tipo de escuela es la misma. 

H 1 : La media de calificaciones para el tipo de escuela no es la 
misma. 

Rechace H 0 si F > 4.26. 

Para Interacción. 

H 0 -, No hay interacción entre el estatus social y el tipo de escuela. 
H | : Hay interacción entre el estatus social y el tipo de escuela. 
Rechace H 0 si F > 3.63. 


ANOVA de dos vías: ventas en relación con social, escuela 

Fuente 

gi 

ss 

MS 

F 

P 

Social 

2 

84.000 

42.0000 

8.49 

0.008 

Escuela 

2 

22.333 

11.1667 

2.26 

0.160 

Interacción 

4 

337.667 

84.4167 

17.07 

0.000 

Error 

9 

44.500 

4.9444 



Total 

17 

488.500 





Existe una diferencia entre las medias de ventas por estatus social, 
pero no por escuelas. Hay Interacción entre el estatus social y las 
escuelas. 

REPASO DE LOS CAPITULOS 13 Y 14 
PROBLEMAS 
1. a) Utilidad 

b) Y = a + biX-, + b 2 X 2 + b 3 X 3 + b 4 X 4 

c) $163 200 

d) Cerca de 86% de la variación de la utilidad neta se explica por 
las cuatro variables. 

e) Cerca de 68% de las utilidades netas estarían dentro de $3 000 
de los estimados, cerca de 95% estaría dentro de 2($3 000), o 
$6 000 de los estimados; y virtualmente todas estarían dentro 
de 3(3 000) o $9 000 de las estimaciones. 


3. a) 0.9261 

b) 2.0469, calculado po V83.8/20 

c ) H 0 : Pi = p 2 = P3 = P4 = 0 

Hi : No todos los coeficientes son 0 

Rechace si F > 2.87, calculado F = 62.697, determinado por 
162.70/4.19. 

d) Podría eliminar X 2 porque la razón de í (1 .29) es menor que el 
valor crítico de t de 2.086. De otro modo, rechace H 0 para X^ X 3 
y X 4 porque todas las razones de t son mayores que 2.086. 

REPASO DE LOS CAPÍTULOS 15 Y 16 
PROBLEMAS 

1. a) 106.1, calculado por (157/148(100) 

b ) 1 00.0, calculado por 1 57/1 57(1 00) 

c) 147.3 + 4.9f y 186.5, calculado por 147.3 + 4.9(8) 

3. Y = [3.5 + 0 . 7 (6 1 )] 1 .20 = [46.2][1 .20] = 55.44 

Y = [3.5 + 0.7(66)]0.90 = (49.7)(0.90) = 44.73 


REPASO DE LOS CAPÍTULOS 17 Y 18 
PROBLEMAS 

1. H 0 : Mediana < 60 
H-¡: Mediana > 60 
|jl = 20(.5) = 1 0 
<T = V20(.5)(.5) = 2.2361 

H 0 se rechaza si z > 1 .65. Hay 1 6 observaciones mayores a 60. 


15.5 - 10.0 
2.2361 


2.46 


Rechace H 0 . La media de ventas por día es mayor a 60. 
3. H 0 : La longitud de población es la misma. 

H 1 : La longitud de población no es la misma. 

H n se rechaza si H es > 5.991 . 


H 


12 


(104.5) 2 (125.5) 2 (70) z 

+ 9 + ~fT 


24(24 + 1)L 7 9 

= 78.451 - 75 = 3.451 

No rechace H 0 . La longitud de población es la misma. 


3(24 + 1) 
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Apéndice C 

Soluciones a los test de práctica 


TEST DE PRÁCTICA (DESPUÉS DEL CAPÍTULO 4) 

PARTE 1 

1. estadísticas 

2. estadísticas descriptivas 

3. población 

4. cuantitativo y cualitativo 

5. discreta 

6. nominal 

7. nominal 

8. cero 

9. siete 

10. 50 

1 1 . varianza 

12. nunca 

13. mediana 

PROBLEMAS 

1. ^(1.18)(1.04)(1.02) = 1.0777 o 7.77% 

2. a) 30 mil dólares 

b) 105 

c) 52 

d) 0.19, calculado por 20/1 05 

e) 165 

f) 120 y 330 

3. a) 70 

b) 71.5 

c) 67.8 

d) 28 

e) 9.34 

4. $44.20, calculado por [(200)$36 + (300)$40 + (500)$50]/1 000 

5. a) gráfica de pastel 

b) 11.1 

c) tres veces 

d) 65% 

TEST DE PRÁCTICA (DESPUÉS DEL CAPÍTULO 7) 

PARTE 1 


PROBLEMAS 

1. a) 0.0526, calculado por (5/20)(4/1 9) 

b) 0.4474, calculado por 1 - (1 5/20)(1 4/1 9) 

2. a) 0.2097, calculado por 1 6(.1 5)(.85) 1S 
b) 0.9257, calculado por 1 - (,85) 16 

3. 720, calculado por 6x5x4x3x2 

4. a) 2.2, calculado por .2(1) + .5(2) + .2(3) + .1(4) 

b) 0.76, calculado por .2(1.44) + .5(0.04) + .2(0.64) + .1(3.24) 

5. a) 0.1808. El valor z para $2 000 es 0.47, calculado por 

(2 000 - 1 600)/850. 

b) 0.4747 calculado por 0.2939 + 0.1 808 

c) 0.0301, calculado por 0.5000 - 0.4699 

6. a) tabla de contingencia 

b) 0.625, calculado por 50/80 

c) 0.75, calculado por 60/80 

d) 0.40, calculado por 20/50 

e) 0.125, calculado por 10/80 

30g — 3 

7. a) 0.0498, calculado por — — — 

33 g — 3 

b) 0.2240, calculado por — — — 

c) 0.1847, calculado por 1 - [0.0498 + 0.1494 + 0.2240 + 
0.2240 + 0.1680] 

d) 0.0025 

TEST DE PRÁCTICA (DESPUÉS DEL CAPÍTULO 9) 

PARTE 1 

1. muestra aleatoria 

2. error de muestreo 

3. error estándar 

4. se reducirá 

5. estimación de puntos 

6. intervalo de confianza 

7. tamaño de la población 

8. proporción 

9. sesgo positivo 
10. 0.5 


1. nunca 

2. experimento 

3. evento 

4. conjunta 

5. a) permutación 
b) combinación 

6. uno 

7. tres o más resultados 

8. infinitas 

9. una 

10. 0.2764 

11. 0.0475 

12. independiente 

13. mutuamente excluyentes 

14. sólo dos resultados 

15. en forma de campana 


= - 1.81 


PARTE 2 

1 . 0.0351 , calculado por 0.5000 - 0.4649. El valor z correspondiente 

11 - 12.2 
2.3/VT2 

2. a) Se desconoce la media de la población. 

b) 9.3 años, que es la media muestral. 

c) 0.3922, calculado por 2/V26 

d) El intervalo de confianza es de 8.63 a 9.97, calculado por 
2 


2.33 

.02 


9.3 ± 1 .7081 ^ 

3. 2 675, calculado por .27(1 - .27)^ 

4. El intervalo de confianza es de 0.5459 a 0.7341 , calculado por 
.64 : 


: 1.96 


.64(1 - .64) 


100 
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TEST DE PRÁCTICA (DESPUÉS DEL CAPÍTULO 12) 
PARTE 1 

1. hipótesis nula 

2. nivel de significancia 

3. cinco 

4. desviación estándar 

5. normalidad 

6. estadístico de prueba 

7. repartido uniformemente entre las dos colas 

8. va de infinito negativo a infinito positivo 

9. independiente 

10. tres y 20 


PART 2 


H 0 : 


t = 


|jl ^ 90 H- 1 : |x > 90 


96 - 90 
12/V18 


2.12 


Si f > 2.567, rechace H 0 . 


No rechace la nula. El tiempo medio en el parque podría ser de 90 
minutos. 


d) 0.3412, calculado por 129.7275/380.1667. 34% de la variación 
en la variable dependiente se explica por la variable 
independiente. 

e) 0.5842, calculado por V0.3412 H 0 : p 0 H 1 :p< 0 

Utilizando un nivel de significancia de 0.01 , rechace 

H 0 si t > 2.467. 
f= 0.5842^30^2 = 3 B1 
V 1 - (0.5842) 2 

Rechace H 0 . Hay una correlación negativa entre las variables. 

2. a) 30 

b) 4 

c) 0.5974, calculado por 227.0928/380.1 667 

d) H 0 \ Pi = (3 2 = P 3 = P 4 = 0 H, : No todas las (3 son 0. 
Rechace H 0 si F > 4.1 8 (usando un nivel de significancia de 
1 %). 

Como el valor calculado de F es 9.27, rechace H 0 . 

No todos los coeficientes de regresión son 0. 

e) Rechace H 0 si f > 2.787 o f < -2.787 (con un nivel de 
significancia de 1 %). Quite inicialmente la variable 2 y vuelva a 
calcular. Quizás quite también las variables 1 o 4. 


2. H, 


o- M-i = M -2 


H 1 : M-i ^ M 2 


gl = 14 + 12 - 2 = 24 

Si í < - 2.064 o t > 2.064, entonces rechace H 0 
2 _ (14 — 1 )(30) 2 + (12 - 1 )(40) 2 


14 + 12-2 
837 - 797 


1 220.83 


1 220.83 


14 


40.0 

13.7455 


: 2.910 


Rechace la hipótesis nula. Hay diferencia entre las medias de las 
millas recorridas. 

a) tres, porque hay 2 gl entre los grupos. 

21 , calculado por los grados totales de libertad más 1 . 

Si el nivel de significancia es 0.05, el valor crítico es 3.55. 


H, 


0- M-1 = M-2 = M3 


H, : las medias de tratamiento no son 


b) 

c) 

d) 

¡guales. 

e) A un nivel de significancia de 5%, se rechaza la hipótesis nula. 

f ) A un nivel de significancia de 5%, podemos concluir que las 
medias de tratamiento difieren. 


TEST DE PRACTICA (DESPUES DEL CAPITULO 16) 
PARTE 1 


1 . 

denominador 

2. 

índice 

3. 

cantidad 

4. 

periodo base 

5. 

1982-1984 

6. 

tendencia 

7. 

movimiento promedio 

8. 

autocorrelación 

9. 

residuo 

10. 

igual 


PARTE 2 

1. a) 


b ) 


1 1 1 .54, calculado por (1 45 000/1 30 000) x 1 00 para 2006 
92.31, calculado por (120 000/130 000) x 100 para 2007 
130.77, calculado por (170 000/130 000) x 100 para 2008 
146.15, calculado por (190 000/130 000) x 100 para 2009 
87.27, calculado por (120 000/137 500) x 100 para 2007 
126.64, calculado por (170 000/137 500) x 100 para 2008 


TEST DE PRÁCTICA (DESPUÉS DEL CAPÍTULO 14) 


138.18, calculado por (190 000/137 500) x 100 para 2009 

PARTE 1 

2. 

a) 1 08.91 , calculado por (1 1 00/1 01 0) x 1 00 

1. vertical 


b) 111.18, calculado por (4 525/4 070) x 1 00 

2. intervalo 


c) 1 1 0.20, calculado por (5 400/4 900) x 1 00 

3. cero 


d) 1 1 0.69, calculado por la raíz cuadrada de (1 1 1 .1 8) x (11 0.20) 

4. -0.77 

3. 

Para enero del quinto año, el pronóstico estacional ajustado es 

5. nunca 


70.0875, calculado por 1.05 x [5.50 + 1.25(49)]. 

6. 7 


Para febrero del quinto año, el pronóstico estacional ajustado es 

7. disminución de 0.5 


66.844, calculado por 0.983 x [5.50 + 1.25(50)]. 

8. -0.9 



9. cero 

TEST DE PRACTICA (DESPUES DEL CAPITULO 18) 

10. ilimitado 

PARTE 1 

11. lineal 

1. 

nominal 

12. residual 

2. 

al menos 30 observaciones 

13. dos 

3. 

dos 

14. matriz de correlación 

4. 

6 

15. distribución normal 

5. 

número de categorías 


6. 

dependiente 

PARTE 2 

7. 

binomial 

1. a) 30 

8. 

comparando dos 0 más muestras independientes 

b) La ecuación de regresión es Y = 90.61 9X - 0.9401 . Si X es 

9. 

nunca 

cero, la línea cruza el eje vertical en -0.9401. A medida que la 
variable independiente aumenta en una unidad, la variable 
dependiente aumenta en 90.619 unidades, 
c) 905.2499 

10. 

poblaciones normales, desviaciones estándar iguales 
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PARTE 2 

1. H 0 \ Las proporciones son como se estableció. 

H 1 : Las proporciones no son como se estableció. 

Usando un nivel de significancia de 0.05, rechace H 0 si X > 7.815. 
2 _ (120 - 130) 2 (40 - 40) 2 

X 130 + 40 

(30 - 20) 2 (10 - 10) 2 „„„ 

20 10 

No rechace H 0 : Las proporciones podrían ser como se estableció. 

2. H 0 \ No hay relación entre el género y el tipo de libro. 

H-i : Hay relación entre el género y el tipo de libro. 

Usando un nivel de significancia de 0.01 , rechace H 0 si X 2 > 9.21 . 

2 (250 - 197.3) 2 (200 - 187.5) 2 

X = + ■ ■ ■ + — = 54.84 

197.3 187.5 

Rechace H 0 : Hay una relación entre el género y el tipo de libro. 

3. H 0 \ Las distribuciones son iguales. 

H i: Las distribuciones no son iguales. 

Rechace H 0 si H > 5.99 


8:00 a.m. Rangos 

10:00 a.m. Rangos 

1:30 p.m. Rangos 

68 

6 

59 

1.5 

67 

5 

84 

20 

59 

1.5 

69 

7 

75 

10.5 

63 

4 

75 

10.5 

78 

15.5 

62 

3 

76 

12.5 

70 

8 

78 

15.5 

79 

17 

77 

14 

76 

12.5 

83 

19 

88 

24 

80 

18 

86 

21.5 

71 

9 



86 

21.5 





87 

23 

Sumas 

107 


56 


137 

Conteo 

8 


7 


9 


12 r 107 2 56^ 137 2 

“ 24(25) [ 8 + 7 + 9 

No rechace H 0 . No hay diferencia 


- 3(25) = 4.29 

en las tres distribuciones. 
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variación residual, 646 
variación secular, 646 
Series con diferentes periodos base, 
595-598 

Sensibilidad, análisis de, 762-763 
Sesgo, 330 

coeficiente de, 119-123, 138 
coeficiente de, de Pearson, 120 
Significancia de la pendiente, 483-486 
Six Sigma, 724 

SPC. Véase Control estadístico del 
proceso 

Suma de errores cuadráticos, 432 
Suposición(es) 

de la regresión lineal, 490-491 
de la regresión múltiple, 531-532 
de linealidad, 532 
en el análisis de la varianza, 416 

T 

Tabla(s) 

ANOVA, 421, 519 
de frecuencias, 23 
de contingencia(s), 126-127, 138, 
162-164 

de números aleatorios, 267-268 
de pagos, 755 

de probabilidad binomial, 198-202 
Tamaño de la muestra, 316-320 
Teorema 

de Bayes, 167-171 
de Chebyshev, 85-86 
Teorema central del límite, 279-286, 300, 
302, 330 


Teoría 

de la probabilidad, 145 
estadística de decisiones, 754 
Término de interacción, 541 
Tipos de estadística, 6-8 
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de razón de la medición, 12-13 
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ordinal, 1 1 

V 

Valor crítico, 339 
deF, 413 
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761-762 

Valor monetario esperado, 756-757. 

Véase también Pago esperado 
Valor p, 346-348 
Valor z, 229, 260 
Variable(s) 
aleatoria, 189, 260 
aleatoria continua, 190, 260 
aleatoria discreta, 190, 260 
continuas, 9 
cualitativas, 8, 23, 537 
cuantitativas, 9, 23 
de bloqueo, 431 
discretas, 9 
ficticia, 537 

Variación, 724. Véase también 
Dispersión 
aleatoria, 419, 725 
asignable, 725 
cíclica, 606-607, 646 
episódica, 646 

estacional, 607, 621-627, 646 

irregular, 608 
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secular, 646 

total, 418 

de tratamiento, 419 
Varianza(s), 79-80, 138, 191 
análisis de la, 41 1 

análisis de la, de dos vías, 430-435 
análisis de la, de dos vías con 
interacción, 435-437 
comparación de, 412-416 
conjunta, 383 

de la diferencia entre medias 
muéstrales, 373-378 
de la población, 80-81 
desiguales, 388 
muestral, 83 

suposiciones en el análisis de la, 416 



FÓRMULAS CLAVE Lind, Marchal y Wathen 


Estadística aplicada a los negocios y la economía 


CAPITULO 3 

• Media poblacional 


Coeficiente de sesgo calculado con software 


2X 


Media de la muestra, datos brutos 


X = ^ 
n 


Media ponderada 


- _ w,Xi + w 2 X 2 + ■ ■ ■ + w„X n 
w w-, + w 2 + ■ ■ ■ + w r 

Media geométrica 

MG = V(X 1 )(X 2 )(X 3 )---(X„) 

Razón de cambio de la media geométrica 

MG = " Valor al final del P eri °do .| q 
V Valor al inicio del periodo 

Rango 

Rango = valor más alto - valor más bajo 
Desviación de la media 

SlX-X 


DM -- 


Varianza poblacional 


S(X-t,) 2 

N 


Desviación estándar poblacional 


Varianza de la muestra 


S(X- ,x) 2 
N 


S(X - X) 2 


(3-1) 


n - 1 

Desviación estándar de la muestra 


S(X -X) 2 
n - 1 


Media muestral, datos agrupados 

o SflW 
n 

Desviación estándar de la muestra, datos agrupados 

1 Zf{M - Xf 

n - 1 

CAPÍTULO 4 

• Localización de un percentil 

l p = (n + 1 ) Too 

• Coeficiente de sesgo de Pearson 

3(X - Mediana) 
sk = 


(3-6) 


(3-7) 


(3-8) 


(3-9) 


(3-10) 


(3-11) 


(3-12) 


(3-13) 


(4-1) 


(4-2) 


sk = 


(n - 1)(n - 2) 


X -X 


P(A|B) : 


P(A,)P{B\A,) 


P(AÍ)P(B\A : ) + P(A 2 )P(B\A¿ 
Fórmula de la multlplicacón 

Total de disposiciones = (m)(n) 
Número de permutaciones 

P = — — — 

n r (n - r ) ! 

Número de combinaciones 

ni 


nC,= 


r!(n - r)l 


CAPITULO 6 

• Media de una distribución de probabilidad 

P = 2[xP(x)] 

• Varianza de una distribución de probabilidad 

a 2 = 2[(x - ri 2 P(x)] 

• Distribución de probabilidad binomial 

P(x)= n C x ^( 1 -k)"-* 

• Media de una distribución binomial 

|X = mr 

• Varianza de una distribución binomial 

tr 2 = r?Ti(1 — tt) 

• Distribución de probabilidad hipergeométrica 
. (sG x )(N-sG n -x) 


P(x) = ' 


N G n 


Distribución de probabilidad de Poisson 


P(x) = ¡ 


x! 


Media de una distribución de Poisson 
^jl = nrr 


(4-3) 



CAPÍTULO 5 

• Regla especial de la adición 


(3-2) 

P(A oB) = P(A) + P(B) 

(5-2) 


• Regla del complemento 



P(A) = 1 - P(~A) 

(5-3) 

(3-3) 

• Regla general de la adición 



P(A o S) = P(A) + P(B) - P(A y B) 

(5-4) 

(3-4) 

• Regla especial de la multiplicación 



P(A y S) = P(A)P(B) 

(5-5) 


• Regla general de la multiplicación 


(3-5) 

P(A y S) = P(A)P(B\A) 

(5-6) 


• Teorema de Bayes 



(5-7) 

(5-8) 

(5-9) 

(5-10) 

( 6 - 1 ) 

( 6 - 2 ) 

(6-3) 

(6-4) 

(6-5) 

( 6 - 6 ) 

(6-7) 

(6-8) 


CAPITULO 7 

• Media de una distribución uniforme 


a + b 


P ; 


Desviación estándar de una distribución uniforme 

k b-af 

12 

Distribución de probabilidad uniforme 


P(x) 


1 


b - a 

Sia<x<i) yOen cualquier lugar 
Distribución de probabilidad normal 

pw = — Ue-r*-*! 


<r V2 tt 


Valor normal estándar 


X- [JL 


• Distribución exponencial 

P(x) = Ae-“ 

• Encontrando una probabilidad usando la distribución 
exponencial 

P(Tiempo de llegada < x) = 1 - 

CAPÍTULO 8 

• Error estándar de la media 


Valor z, (j, y u conocidas 


Vh 


X - n 
tr/Vñ 


CAPITULO 9 

• Intervalo de confianza de p,, con <r conocida 


X ± z 


Vñ 


Intervalo de confianza de ¡x, con <r desconocida 
s 


X±t 


Vñ 


Proporción de la muestra 


Intervalo de confianza de una proporción 
P(1 - P) 


P ±z 


n 


(7-1) 


(7-2) 


(7-3) 


(7-4) 


(7-5) 


(7-6) 


(7-7) 


( 8 - 1 ) 


( 8 - 2 ) 


(9-1) 


(9-2) 


(9-3) 


(9-4) 


• Tamaño de la muestra para estimar la media de la población 

( ZCT 


n 


Tamaño de la muestra de una proporción 


n — it(1 — 7t) 


(9-5) 


(9-6) 


CAPITULO 10 

• Prueba de una media, con o- conocida 


X- 


P 


cr /Vñ 

• Prueba de una media, con cr desconocida 

s/Vñ 

• Prueba de una hipótesis, con una proporción 

P — IT 

Z ítt(1 — tt) 

V n 

_ *c - Pl 

cr/Vñ 


Error de tipo I 


( 10 - 1 ) 


( 10 - 2 ) 


(10-3) 


(10-4) 


CAPITULO 11 

• Varianza de la distribución de las diferencias en medias 

^ of + ai (11-1) 

*’ n-, n 2 

• Prueba de dos medias muéstrales, con cr conocida 

Xi - X 2 


Proporción conjunta 


Pc = 


ir? + trl 
r?i n 2 


X, +X 2 


n, + n 2 

Prueba de proporciones de dos muestras 
Pi ~ P 2 


Pc(1 - Pe) , Pc(1 - Pe) 


Varianza conjunta 


n 2 


(n 1 - 1)s? + (n 2 - 1) s| 
n, + n 0 - 2 


( 11 - 2 ) 


(11-4) 


(11-3) 


(11-5) 


Prueba de las medias de dos muestras, cr desconocida pero 
igual 


t = - 


X, -X 2 

I* l± + ± 

n 2 , 


r* W 


( 11 - 6 ) 


Prueba de las medias de dos muestras, cr s desconocida y 
desigual 


í = 


X, — X 2 

„2 9 2 
Si | Si 

n 1 n 2 


(11-7) 


• Grados de libertad de una prueba de varianza desigual 
[(s?/ ni ) + (s 2 /n 2 )] 2 


gi = 


Prueba de f pareada 


(s?/ni) 2 | (s 2 /n 2 ) 2 
r?i - 1 n 2 - 1 


í = - 


( 11 - 8 ) 


s d /\/ñ 

CAPÍTULO 12 

• Prueba para comparar dos varianzas 


F = S Í 


(11-9) 


( 12 - 1 ) 


• Suma total de cuadrados 


Intervalo de predicción 


Total SC = 2(X-X G ) 2 

• Suma del error de cuadrados 

ESC = 2(X-XJ 2 

• Suma del tratamiento de cuadrados 

TSC = SC total - ESC 


( 12 - 2 ) 


( 12 - 3 ) 


( 12 - 4 ) 


• Intervalo de confianza de las diferencias en las medias de 
tratamiento 


(Xt - x 2 \±t JesmÍ— + — 

’ v Vn-, n 2 , 

• Suma de los cuadrados, bloques 

SCB = kJ,(X b - X G f 

• Suma de cuadrados ANOVA de dos vías 

SEC = SC total - TSC - SCB 

• Suma de cuadrados por interacción 

SCI = n/bk 22 (X s - X¡ - X¡ + X G f 

• Suma de los errores de cuadrados con interacción 


( 12 - 5 ) 

( 12 - 6 ) 

( 12 - 7 ) 

( 12 - 8 ) 


SEC = SC total - SC factor A - SC del factor B - SCI ( 12 - 9 ) 

CAPÍTULO 13 

• Coeficiente de correlación 


f = 


r £(X-X)(y- Y) 

(n - 1) s*s y 

Prueba de la significancia de la correlación 

rVn - 2 

VT^T 2 

• Ecuación de la regresión lineal 

Y = a + bX 

• Pendiente de la recta de regresión 


b = r=- 

^x 


• Intersección de la recta de regresión 

a = Y - bX 

• Prueba para una pendiente cero 

f= b-0 

s b 

• Error estándar del estimado 


„ _ IW-Y) 2 

s **-' 1 n — 2 


• Coeficiente de determinación 

2 = RSC 
r SC total 

• Intervalo de confianza 


SEC 
SC total 


( 13 - 1 ) 


( 13 - 2 ) 


( 13 - 3 ) 


( 13 - 4 ) 


( 13 - 5 ) 


( 13 - 6 ) 


( 13 - 7 ) 


( 13 - 8 ) 


Y ± t(s y . x ) Jl+!+ ( X -^) 2 
' n 2(X - X) 2 

CAPÍTULO 14 

• Ecuación de la regresión múltiple 

Y — a + b- jX-, + ¿> 2 X 2 + ■ ■ ■ + b k X k 

• Error estándar de estimación múltiple 


s v. 123 ... * 


E(V - Yf 


1 n - (k + 1) 

• Coeficiente de determinación múltiple 

pp RSC 
SC total 

• Coeficiente de determinación ajustado 

_ SEC 

q 2 n 

•'ai 


' adj 


1 


n - (k+ 1) 


• Prueba global de hipótesis 


F = - 


SC total 
n - 1 


RSC A 


SEC ![n - (k+ 1)] 

Prueba de un coeficiente de regresión particular 

t = b^-0 
Si ,, 

Varianza del factor de inflación 


FIV = 


CAPITULO 15 

• índice simple 


1 -Rf 


P = ^ (1 00) 
Po 


Promedio simple de los precios relativos 


2 P, 


• Indice simple agregado 


p =!¡< ioo > 


• Indice de precios Laspeyres 

2pflo 


P = 


SPoQo 


( 100 ) 


Indice de precios Paasche 


p = |Mi (100 ) 


SPoQt 


Indice Ideal de Fischer 


( 13 - 10 ) 


( 14 - 1 ) 


( 14 - 2 ) 


( 14 - 3 ) 


( 14 - 4 ) 


( 14 - 5 ) 


( 14 - 6 ) 


( 14 - 7 ) 


( 15 - 1 ) 


( 15 - 2 ) 


( 15 - 3 ) 


( 15 - 4 ) 


( 15 - 5 ) 


V(índlce de precios Laspeyre)((ndlce de preciosPaasche) 
• índice de valor 

v= 2 ML(ioo) 

2p 0 Po 


( 15 - 6 ) 


Y±t(s y . x ) J í + (X-X) 2 
'n 2(X — X) : 


( 13 - 9 ) 


( 15 - 7 ) 


Ingreso real 


• Prueba Kruskal-Wallis 


Ingreso monetario 

Ingreso real = — ^ (100) 


(15-8) 


Uso de un índice como deflacionador 

nt; 

índice 

$1 


, Ventas reales , 

Ventas deflacionadas = ; — (100) (15-9) 


Poder de compra 

Poder de compra 


IPC 


( 100 ) 


CAPITULO 16 

• Tendencia lineal 

Y = a + bt 

• Ecuación de la tendencia logarítmica 

log Y = log a + log b(t) 

• Factor de correlación de medias trimestrales ajustadas 

. 4.00 

Factor de correlación = 

Total de muestras 

• Estadística de Durbln-Watson 

S < e t _ e t- 1) 2 


d = 


(15-10) 

(16-1) 

(16-2) 

(16-3) 

(16-4) 


2e? 


CAPITULO 17 

• Prueba estadística de ¡i cuadrada 


x 2 = 2 


(fp - fe) 2 

u 


Frecuencia esperada 


L = 


(Total de la fila)(Total de la columna) 


Gran total 


CAPITULO 18 

• Prueba de los signos, n > 10 


(X ± .50) - ¡x 


Prueba de la suma de los rangos de Wilcoxon 


W - 


n-iíp i + n 2 + 1) 


¡ n i n 2 ( n i + n 2 + 1) 


(17-1) 


(17-2) 


(18-1) 


(18-4) 


r 


12 


H = 12 Í P fí i ) 2 , mi , . . , (Wl 

n(n + 1) L n-¡ n 2 n k \ 

- 3(n + 1) (18-5) 

• Coeficiente de correlación de los rangos de Spearman 


„ 6 2d 2 

rs “ n(n 2 - 1) 

• Prueba de la hipótesis, rango de correlación 

t = r s 

CAPÍTULO 19 

• Media total 

de control, media 

LCS = ^ + A 2 R LCI = X - A 2 R 
de control, rango 

LCS = D 4 R LCI = D 3 R 

• Proporción media de defectos 

_ Suma de defectos 

P Número total de artículos de la muestra 

• Límites de control, proporción 


• Límites 


• Límites 


n-2 


W 


2X 


(18-6) 

(18-7) 

(19-1) 

(19-4) 

(19-5) 

(19-6) 


LCS y LCI = p ± 3 ^0 P) (19 . 8 ) 

• Límites de control, diagramas de líneas c 

LCS y LCI = c ± 3 Ve (19-9) 


CAPÍTULO 20 

• Valor monetario esperado 

VME(A f ) = W(Sj) ■ Sj )] (20-1) 

• Pérdida de oportunidad esperada 

POE(A ( ) = W(Sj) ■ R(A¡, Sj)] (20-2) 

• Vaor esperado de la información perfecta 

VEIP = Valor esperado en condiciones de certeza 
- Valor esperado de decisión óptima 
en condiciones de incertidumbre (20-3) 


Distribución fde Student 



Intervalo de confianza, c 



80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia para 

una prueba de una cola, a 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia para una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

i 

3.078 

6.314 

12.706 

31.821 

63.657 

636.619 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

31.599 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

12.924 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

8.610 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

6.869 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

5.959 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

5.408 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

5.041 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

4.781 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

4.587 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

4.437 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

4.318 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

4.221 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

4.140 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

4.073 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

4.015 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

3.965 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

3.922 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

3.883 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

3.850 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

3.819 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

3.792 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

3.768 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

3.745 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

3.725 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

3.707 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

3.690 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

3.674 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

3.659 

30 

1.310 

1.697 

2.042 

2.457 

2.750 

3.646 

31 

1.309 

1.696 

2.040 

2.453 

2.744 

3.633 

32 

1.309 

1.694 

2.037 

2.449 

2.738 

3.622 

33 

1.308 

1.692 

2.035 

2.445 

2.733 

3.611 

34 

1.307 

1.691 

2.032 

2.441 

2.728 

3.601 

35 

1.306 

1.690 

2.030 

2.438 

2.724 

3.591 


(continúa parte superior derecha) 


(continúa) 


Intervalo de confianza, c 


80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia para una prueba de una cola, a 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia para una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

36 

1.306 

1.688 

2.028 

2.434 

2.719 

3.582 

37 

1.305 

1.687 

2.026 

2.431 

2.715 

3.574 

38 

1.304 

1.686 

2.024 

2.429 

2.712 

3.566 

39 

1.304 

1.685 

2.023 

2.426 

2.708 

3.558 

40 

1.303 

1.684 

2.021 

2.423 

2.704 

3.551 

41 

1.303 

1.683 

2.020 

2.421 

2.701 

3.544 

42 

1.302 

1.682 

2.018 

2.418 

2.698 

3.538 

43 

1.302 

1.681 

2.017 

2.416 

2.695 

3.532 

44 

1.301 

1.680 

2.015 

2.414 

2.692 

3.526 

45 

1.301 

1.679 

2.014 

2.412 

2.690 

3.520 

46 

1.300 

1.679 

2.013 

2.410 

2.687 

3.515 

47 

1.300 

1.678 

2.012 

2.408 

2.685 

3.510 

48 

1.299 

1.677 

2.011 

2.407 

2.682 

3.505 

49 

1.299 

1.677 

2.010 

2.405 

2.680 

3.500 

50 

1.299 

1.676 

2.009 

2.403 

2.678 

3.496 

51 

1.298 

1.675 

2.008 

2.402 

2.676 

3.492 

52 

1.298 

1.675 

2.007 

2.400 

2.674 

3.488 

53 

1.298 

1.674 

2.006 

2.399 

2.672 

3.484 

54 

1.297 

1.674 

2.005 

2.397 

2.670 

3.480 

55 

1.297 

1.673 

2.004 

2.396 

2.668 

3.476 

56 

1.297 

1.673 

2.003 

2.395 

2.667 

3.473 

57 

1.297 

1.672 

2.002 

2.394 

2.665 

3.470 

58 

1.296 

1.672 

2.002 

2.392 

2.663 

3.466 

59 

1.296 

1.671 

2.001 

2.391 

2.662 

3.463 

60 

1.296 

1.671 

2.000 

2.390 

2.660 

3.460 

61 

1.296 

1.670 

2.000 

2.389 

2.659 

3.457 

62 

1.295 

1.670 

1.999 

2.388 

2.657 

3.454 

63 

1.295 

1.669 

1.998 

2.387 

2.656 

3.452 

64 

1.295 

1.669 

1.998 

2.386 

2.655 

3.449 

65 

1.295 

1.669 

1.997 

2.385 

2.654 

3.447 

66 

1.295 

1.668 

1.997 

2.384 

2.652 

3.444 

67 

1.294 

1.668 

1.996 

2.383 

2.651 

3.442 

68 

1.294 

1.668 

1.995 

2.382 

2.650 

3.439 

69 

1.294 

1.667 

1.995 

2.382 

2.649 

3.437 

70 

1.294 

1.667 

1.994 

2.381 

2.648 

3.435 


(continúa) 


Distribución t de Student (conclusión) 


( continúa ) 


Intervalo de confianza, c 



80% 

90% 

95% 

98% 

99% 

99.9% 


Nivel de significancia para una prueba de una cola, a 

gi 

0.10 

0.05 

0.025 

0.01 

0.005 

0.0005 


Nivel de significancia para una prueba de dos colas, a 


0.20 

0.10 

0.05 

0.02 

0.01 

0.001 

71 

1.294 

1.667 

1.994 

2.380 

2.647 

3.433 

72 

1.293 

1.666 

1.993 

2.379 

2.646 

3.431 

73 

1.293 

1.666 

1.993 

2.379 

2.645 

3.429 

74 

1.293 

1.666 

1.993 

2.378 

2.644 

3.427 

75 

1.293 

1.665 

1.992 

2.377 

2.643 

3.425 

76 

1.293 

1.665 

1.992 

2.376 

2.642 

3.423 

77 

1.293 

1.665 

1.991 

2.376 

2.641 

3.421 

78 

1.292 

1.665 

1.991 

2.375 

2.640 

3.420 

79 

1.292 

1.664 

1.990 

2.374 

2.640 

3.418 

80 

1.292 

1.664 

1.990 

2.374 

2.639 

3.416 

81 

1.292 

1.664 

1.990 

2.373 

2.638 

3.415 

82 

1.292 

1.664 

1.989 

2.373 

2.637 

3.413 

83 

1.292 

1.663 

1.989 

2.372 

2.636 

3.412 

84 

1.292 

1.663 

1.989 

2.372 

2.636 

3.410 

85 

1.292 

1.663 

1.988 

2.371 

2.635 

3.409 

86 

1.291 

1.663 

1.988 

2.370 

2.634 

3.407 

87 

1.291 

1.663 

1.988 

2.370 

2.634 

3.406 

88 

1.291 

1.662 

1.987 

2.369 

2.633 

3.405 

89 

1.291 

1.662 

1.987 

2.369 

2.632 

3.403 

90 

1.291 

1.662 

1.987 

2.368 

2.632 

3.402 

91 

1.291 

1.662 

1.986 

2.368 

2.631 

3.401 

92 

1.291 

1.662 

1.986 

2.368 

2.630 

3.399 

93 

1.291 

1.661 

1.986 

2.367 

2.630 

3.398 

94 

1.291 

1.661 

1.986 

2.367 

2.629 

3.397 

95 

1.291 

1.661 

1.985 

2.366 

2.629 

3.396 

96 

1.290 

1.661 

1.985 

2.366 

2.628 

3.395 

97 

1.290 

1.661 

1.985 

2.365 

2.627 

3.394 

98 

1.290 

1.661 

1.984 

2.365 

2.627 

3.393 

99 

1.290 

1.660 

1.984 

2.365 

2.626 

3.392 

100 

1.290 

1.660 

1.984 

2.364 

2.626 

3.390 

120 

1.289 

1.658 

1.980 

2.358 

2.617 

3.373 

140 

1.288 

1.656 

1.977 

2.353 

2.611 

3.361 

160 

1.287 

1.654 

1.975 

2.350 

2.607 

3.352 

180 

1.286 

1.653 

1.973 

2.347 

2.603 

3.345 

200 

1.286 

1.653 

1.972 

2.345 

2.601 

3.340 

00 

1.282 

1.645 

1.960 

2.326 

2.576 

3.291 


Areas bajo la curva normal 


Ejemplo: 

Si z= 1.96, entonces 
P ( 0 a z) = 0.4750. 



1.96 


z 

0.00 

0.01 

0.02 

0.03 

0.04 

0.05 

0.06 

0.07 

0.08 

0.09 

0.0 

0.0000 

0.0040 

0.0080 

0.0120 

0.0160 

0.0199 

0.0239 

0.0279 

0.0319 

0.0359 

0.1 

0.0398 

0.0438 

0.0478 

0.0517 

0.0557 

0.0596 

0.0636 

0.0675 

0.0714 

0.0753 

0.2 

0.0793 

0.0832 

0.0871 

0.0910 

0.0948 

0.0987 

0.1026 

0.1064 

0.1103 

0.1141 

0.3 

0.1179 

0.1217 

0.1255 

0.1293 

0.1331 

0.1368 

0.1406 

0.1443 

0.1480 

0.1517 

0.4 

0.1554 

0.1591 

0.1628 

0.1664 

0.1700 

0.1736 

0.1772 

0.1808 

0.1844 

0.1879 

0.5 

0.1915 

0.1950 

0.1985 

0.2019 

0.2054 

0.2088 

0.2123 

0.2157 

0.2190 

0.2224 

0.6 

0.2257 

0.2291 

0.2324 

0.2357 

0.2389 

0.2422 

0.2454 

0.2486 

0.2517 

0.2549 

0.7 

0.2580 

0.2611 

0.2642 

0.2673 

0.2704 

0.2734 

0.2764 

0.2794 

0.2823 

0.2852 

0.8 

0.2881 

0.2910 

0.2939 

0.2967 

0.2995 

0.3023 

0.3051 

0.3078 

0.3106 

0.3133 

0.9 

0.3159 

0.3186 

0.3212 

0.3238 

0.3264 

0.3289 

0.3315 

0.3340 

0.3365 

0.3389 

1.0 

0.3413 

0.3438 

0.3461 

0.3485 

0.3508 

0.3531 

0.3554 

0.3577 

0.3599 

0.3621 

1.1 

0.3643 

0.3665 

0.3686 

0.3708 

0.3729 

0.3749 

0.3770 

0.3790 

0.3810 

0.3830 

1.2 

0.3849 

0.3869 

0.3888 

0.3907 

0.3925 

0.3944 

0.3962 

0.3980 

0.3997 

0.4015 

1.3 

0.4032 

0.4049 

0.4066 

0.4082 

0.4099 

0.4115 

0.4131 

0.4147 

0.4162 

0.4177 

1.4 

0.4192 

0.4207 

0.4222 

0.4236 

0.4251 

0.4265 

0.4279 

0.4292 

0.4306 

0.4319 

1.5 

0.4332 

0.4345 

0.4357 

0.4370 

0.4382 

0.4394 

0.4406 

0.4418 

0.4429 

0.4441 

1.6 

0.4452 

0.4463 

0.4474 

0.4484 

0.4495 

0.4505 

0.4515 

0.4525 

0.4535 

0.4545 

1.7 

0.4554 

0.4564 

0.4573 

0.4582 

0.4591 

0.4599 

0.4608 

0.4616 

0.4625 

0.4633 

1.8 

0.4641 

0.4649 

0.4656 

0.4664 

0.4671 

0.4678 

0.4686 

0.4693 

0.4699 

0.4706 

1.9 

0.4713 

0.4719 

0.4726 

0.4732 

0.4738 

0.4744 

0.4750 

0.4756 

0.4761 

0.4767 

2.0 

0.4772 

0.4778 

0.4783 

0.4788 

0.4793 

0.4798 

0.4803 

0.4808 

0.4812 

0.4817 

2.1 

0.4821 

0.4826 

0.4830 

0.4834 

0.4838 

0.4842 

0.4846 

0.4850 

0.4854 

0.4857 

2.2 

0.4861 

0.4864 

0.4868 

0.4871 

0.4875 

0.4878 

0.4881 

0.4884 

0.4887 

0.4890 

2.3 

0.4893 

0.4896 

0.4898 

0.4901 

0.4904 

0.4906 

0.4909 

0.4911 

0.4913 

0.4916 

2.4 

0.4918 

0.4920 

0.4922 

0.4925 

0.4927 

0.4929 

0.4931 

0.4932 

0.4934 

0.4936 

2.5 

0.4938 

0.4940 

0.4941 

0.4943 

0.4945 

0.4946 

0.4948 

0.4949 

0.4951 

0.4952 

2.6 

0.4953 

0.4955 

0.4956 

0.4957 

0.4959 

0.4960 

0.4961 

0.4962 

0.4963 

0.4964 

2.7 

0.4965 

0.4966 

0.4967 

0.4968 

0.4969 

0.4970 

0.4971 

0.4972 

0.4973 

0.4974 

2.8 

0.4974 

0.4975 

0.4976 

0.4977 

0.4977 

0.4978 

0.4979 

0.4979 

0.4980 

0.4981 

2.9 

0.4981 

0.4982 

0.4982 

0.4983 

0.4984 

0.4984 

0.4985 

0.4985 

0.4986 

0.4986 

3.0 

0.4987 

0.4987 

0.4987 

0.4988 

0.4988 

0.4989 

0.4989 

0.4989 

0.4990 

0.4990 


